扩散模型 - 智狐AI导航

MotionFix

MotionFix是一个开源的3D人体动作编辑工具，采用自然语言描述与条件扩散模型TMED相结合的方式，支持通过文本指令精准编辑3D人体动作。其主要功能包括文本驱动的动作编辑、半自动数据集构建、多模态输入处理及基于检索的评估指标。MotionFix适用于动画制作、游戏开发、虚拟现实等多个领域，为动作编辑提供了灵活性与精确性。

AI项目与工具 2025年06月12日 13 点赞 0 评论 656 浏览

EnerVerse

EnerVerse是由智元机器人团队开发的首个机器人4D世界模型，基于自回归扩散模型与稀疏记忆机制，实现未来具身空间的高效生成与动作规划。其核心技术包括逐块生成、时空注意力UNet结构、自由锚定视角（FAV）及Diffusion策略头，显著提升机器人在复杂任务中的表现。该模型已在自动驾驶、工业装配、医疗辅助等多个领域展现出广泛应用潜力。

AI项目与工具 2025年06月12日 92 点赞 0 评论 654 浏览

CineMaster

CineMaster是快手推出的3D感知视频生成框架，支持通过文本提示及深度图、相机轨迹等控制信号生成高质量视频内容。其核心功能包括3D物体与摄像机控制、交互式设计、自动化数据标注和高质量视频输出。采用两阶段工作流程与扩散模型技术，结合语义布局控制网络与摄像机适配器，提升视频生成的精确度与灵活性。适用于影视制作、广告营销、游戏开发等多个领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 649 浏览

Animate Anyone 2

Animate Anyone 2 是由阿里巴巴通义实验室开发的高保真角色动画生成技术，能基于输入图像和运动信号生成高质量、自然流畅的角色动画。通过环境感知、形状无关掩码策略、物体交互增强等技术，实现角色与环境的深度融合，提升动画的真实感与稳定性。支持复杂动作处理、多角色互动及跨身份动画生成，适用于影视、广告、VR/AR、游戏及教育等多个领域。

AI项目与工具 2025年06月12日 50 点赞 0 评论 648 浏览

Lumina

Lumina-Image 2.0 是一款开源图像生成模型，基于扩散模型与 Transformer 架构，具有 26 亿参数。它能根据文本描述生成高质量、多风格的图像，支持中英文提示词，并具备强大的复杂提示理解能力。模型支持多种推理求解器，适用于艺术创作、摄影风格图像生成及逻辑推理场景，兼具高效性和灵活性。

AI项目与工具 2025年06月12日 27 点赞 0 评论 648 浏览

Gemini Diffusion

Gemini Diffusion是谷歌推出的实验性文本扩散模型，通过逐步细化噪声生成文本，具备快速响应、生成更连贯文本和迭代细化等能力。与传统自回归模型不同，它能并行生成文本，提高效率。在外部基准测试中表现优异，速度更快，适用于内容创作、代码生成、数学问题解答和文本编辑等场景。用户需加入等待名单获取访问权限。

AI项目与工具 2025年06月11日 48 点赞 0 评论 647 浏览

OneDiffusion

OneDiffusion是一种多功能的大规模扩散模型，支持文本到图像生成、条件图像生成、图像理解等多种任务。它通过序列建模和流匹配框架实现灵活的图像生成能力，适用于艺术创作、广告设计、游戏开发等多个领域，具备高度的扩展性和统一性。

AI项目与工具 2025年06月12日 59 点赞 0 评论 643 浏览

SVDQuant

SVDQuant是一种由MIT研究团队开发的后训练量化技术，专注于通过4位量化减少扩散模型的内存占用和推理延迟。它利用低秩分支技术吸收量化异常值，支持DiT和UNet架构，并能无缝集成LoRAs。SVDQuant适用于移动设备、个人电脑、云计算平台及低功耗设备，可大幅提升图像生成和处理效率。

AI项目与工具 2025年06月12日 76 点赞 0 评论 643 浏览

TurboEdit

TurboEdit是一款由Adobe Research开发的AI即时图像编辑模型。它通过编码器迭代反演和基于文本的精细控制，在数步内实现图像的精确编辑。用户可以通过修改详细的文本提示来引导图像编辑，实现对图像特定属性的精确修改。TurboEdit具备快速高效的特性，支持实时编辑，并在文本引导下的图像编辑方面表现出色。

AI项目与工具 2025年06月12日 75 点赞 0 评论 642 浏览

PlayDiffusion

PlayDiffusion是Play AI推出的音频编辑模型，基于扩散模型技术实现音频的精细编辑和修复。它将音频编码为离散标记序列，通过掩码处理和去噪生成高质量音频，保持语音连贯性和自然性。支持局部编辑、高效文本到语音合成、动态语音修改等功能，具有非自回归特性，提升生成速度与质量。适用于配音纠错、播客剪辑、实时语音互动等场景。

AI项目与工具 2025年06月11日 94 点赞 0 评论 641 浏览

扩散模型

首页

扩散模型

列表

默认

浏览次数

发布日期