虚拟 - 智狐AI导航

Perception

Perception-as-Control是由阿里巴巴通义实验室开发的图像动画框架，支持对相机和物体运动的细粒度控制。它基于3D感知运动表示，结合U-Net架构的扩散模型，实现多种运动相关的视频合成任务，如运动生成、运动克隆、转移和编辑。通过三阶段训练策略，提升运动控制精度和稳定性，适用于影视、游戏、VR/AR、广告及教育等多个领域。

AI项目与工具 2025年06月12日 20 点赞 0 评论 681 浏览

TryOffDiff

TryOffDiff是一种基于扩散模型的虚拟试穿技术，通过高保真服装重建实现从单张穿着者照片生成标准化服装图像的功能。它能够精确捕捉服装的形状、纹理和复杂图案，并在生成模型评估和高保真重建领域具有广泛应用潜力，包括电子商务、个性化推荐、时尚设计展示及虚拟时尚秀等场景。

AI项目与工具 2025年06月12日 34 点赞 0 评论 680 浏览

IDM

IDM-VTON是一种基于改进扩散模型的先进AI虚拟试穿技术，由韩国科学技术院和OMNIOUS.AI的研究人员共同开发。该技术利用视觉编码器提取服装的高级语义信息，并通过GarmentNet捕捉服装的低级细节特征，从而生成逼真的人物穿戴图像。IDM-VTON支持文本提示理解，实现了个性化定制和逼真的试穿效果，广泛应用于电子商务、时尚零售、个性化推荐、社交媒体以及时尚设计等领域。

AI项目与工具 2024年01月01日 49 点赞 0 评论 680 浏览

MTVCrafter是由中国科学院深圳先进技术研究院计算机视觉与模式识别实验室、中国电信人工智能研究所等机构推出的新型人类图像动画框架，基于4D运动标记化（4DMoT）和运动感知视频扩散Transformer（MV-DiT）实现高质量动画生成。该工具直接对3D运动序列建模，支持泛化到多种角色和风格，保持身份一致性，并在TikTok基准测试中取得优异成绩。其应用场景包括数字人动画、虚拟试穿、沉浸式内

AI项目与工具 2025年06月11日 50 点赞 0 评论 679 浏览

Wonder Animation

Wonder Animation是一款基于AI的视频到3D场景转换工具，由Autodesk的Wonder Dynamics研发。它能够将视频序列转化为包含摄像机设置和角色动画的3D动画场景，支持多剪辑和多种镜头处理。通过深度学习和计算机视觉技术，Wonder Animation在3D空间中重建场景，并确保动作和场景的高度同步与一致。此工具特别适合动画电影制作、视频游戏开发、虚拟制作以及增强现实和虚

AI项目与工具 2025年06月12日 43 点赞 0 评论 675 浏览