图像

I2V3D

I2V3D是一款由香港城市大学与微软GenAI合作开发的图像到视频生成工具,支持将静态图像转换为高质量动态视频。其核心在于结合传统CG管线与生成式AI技术,采用两阶段生成流程实现精准的3D动画控制,支持复杂场景编辑和灵活的视频生成,适用于动画制作、视频创作及教育等多个领域。

洞图

洞图是一款集多功能于一体的AI图片处理工具,主要功能包括制作隐藏文字的幻觉图片、生成逼真的AI写真、智能擦除路人、照片动态化、AI换脸、美肤优化、风格滤镜应用以及照片清晰度提升等。其简洁的操作界面和强大处理能力,使用户能快速生成个性化图文素材,适用于多种应用场景,如社交媒体分享、隐私保护、形象照制作及照片修复等。

Voyage Multimodal

Voyage Multimodal-3 是一款多模态嵌入模型,能够处理文本、图像以及它们的混合数据,无需复杂文档解析即可提取关键视觉特征。它在多模态检索任务中的准确率显著高于现有最佳模型,支持语义搜索和文档理解,适用于法律、金融、医疗等多个领域的复杂文档检索任务。

Tome

Tome AI是一个利用人工智能来...

WarpVideo

WarpVideo是一款基于人工智能的视频创作工具,提供视频转视频、图像转视频、文本转视频及视频缩放等多种功能,支持用户快速高效地完成视频风格转换与格式调整。它广泛应用于电影制作、营销推广、社交媒体内容创作、教育培训及新闻报道等领域,助力用户轻松打造专业级视频内容。

MMaDA

MMaDA(Multimodal Large Diffusion Language Models)是由普林斯顿大学、清华大学、北京大学和字节跳动联合开发的多模态扩散模型,支持跨文本推理、多模态理解和文本到图像生成等多种功能。其采用统一的扩散架构和模态不可知设计,结合混合长链推理微调策略与UniGRPO强化学习算法,提升跨模态任务性能。MMaDA在多项任务中表现优异,适用于内容创作、教育辅助、智能客

Thetawise

Thetawise 是一款面向学生的 AI 数学辅导工具,支持多种输入方式,可生成详细解题步骤,帮助学生理解数学问题。它提供个性化学习计划、高级求解器、实时聊天支持及学习进度分析等功能,适用于课后辅导、考试准备、自学及远程教育等场景,有效提升数学学习效率。

Project Turntable

Project Turntable是一款由Adobe发布的AI工具,支持用户在三维空间中旋转二维矢量图像,并利用生成式AI和深度学习技术即时生成图像的隐藏部分。它显著提升了设计师的工作效率,减少了重复性劳动,适用于平面设计、插画创作、动画制作及游戏开发等领域,同时保持了图像的二维特性和平滑过渡效果。

BlockDance

BlockDance是由复旦大学与字节跳动联合开发的扩散模型加速技术,通过识别结构相似的时空特征(STSS)减少冗余计算,提升推理效率达25%-50%。结合强化学习的BlockDance-Ada模块实现动态资源分配,平衡速度与质量。适用于图像、视频生成及实时应用,支持多种模型,兼顾高效与高质,适用于资源受限环境。

DiffSplat

DiffSplat是一款高效的3D生成工具,能够根据文本或图像快速生成高质量的3D高斯点云。它基于预训练的文本到图像扩散模型,结合2D先验知识和3D渲染损失机制,确保生成内容在多视角下保持一致。支持文本、图像或组合输入,具备可控生成能力,适用于3D内容创作、图像重建及多种下游应用。