虚拟 - 智狐AI导航

EMAGE

EMAGE是一款基于音频输入生成全身手势的AI框架，可同步生成面部表情、肢体动作及整体运动。通过掩蔽音频手势变换器和多模块VQ-VAE建模，实现高质量、多样化的手势生成。适用于虚拟现实、动画制作、数字人交互等领域，提升虚拟角色表现力与交互自然度。

AI项目与工具 2025年06月12日 13 点赞 0 评论 726 浏览

Wavtool

Wavtool 是一款基于浏览器的 AI 音频创作平台，支持录制、编曲、混音和导出音乐，提供 AI 辅助创作功能，支持多轨处理及高级合成工具。用户可通过浏览器直接操作，无需安装软件，适合音乐爱好者、专业人士及教育用途。

AI项目与工具 2025年06月12日 20 点赞 0 评论 727 浏览

ACTalker

ACTalker 是一种基于视频扩散模型的端到端工具，可生成高质量、自然的说话人头部视频。支持多信号控制（如音频、表情），采用并行 Mamba 结构和门控机制，实现跨时间和空间的精准面部动作控制。实验表明其在音频同步性和视频质量上表现优异，适用于虚拟主播、远程会议、在线教育等多种场景。

AI项目与工具 2025年06月12日 99 点赞 0 评论 728 浏览

VASA

VASA-1是一个由微软亚洲研究院开发的生成框架，能够将静态照片转化为动态的口型同步视频。该框架利用精确的唇音同步、丰富的面部表情和自然的头部运动，创造出高度逼真的虚拟人物形象。VASA-1支持在线生成高分辨率视频，具有低延迟的特点，并且能够处理多种类型的输入，如艺术照片、歌唱音频和非英语语音。此外，通过灵活的生成控制，用户可以调整输出的多样性和适应性。

AI项目与工具 2025年06月12日 83 点赞 0 评论 728 浏览

Cartwheel 是一款基于文本到动画（Text-to-Motion）技术的 AI 3D 动画生成平台，用户只需输入文本描述即可快速生成高质量的 3D 角色动画。平台结合深度学习与传统动画技术，支持动作捕捉、自动化运动合成，并与主流 3D 软件无缝集成。其功能包括文本驱动动画、可编辑动画、动作库预设等，适用于游戏开发、影视制作、广告营销、VR/AR 及教育等多个场景。Cartwheel 提供不同

AI项目与工具 2025年06月11日 14 点赞 0 评论 729 浏览

Project Turntable

Project Turntable是一款由Adobe发布的AI工具，支持用户在三维空间中旋转二维矢量图像，并利用生成式AI和深度学习技术即时生成图像的隐藏部分。它显著提升了设计师的工作效率，减少了重复性劳动，适用于平面设计、插画创作、动画制作及游戏开发等领域，同时保持了图像的二维特性和平滑过渡效果。

AI项目与工具 2025年06月12日 92 点赞 0 评论 729 浏览

云从科技从容大模型

云从科技从容大模型是一个多功能、跨行业的AI大模型，它通过集成云从科技的核心技术，为用户提供个性化、智能化的服务和解决方案。

创作工具 2026年06月24日 0 点赞 0 评论 732 浏览

Pixel3DMM

Pixel3DMM是由慕尼黑工业大学、伦敦大学学院和Synthesia联合开发的单图像3D人脸重建框架，基于DINOv2模型，能从单张RGB图像中准确重建出3D人脸的几何结构。该工具擅长处理复杂表情和姿态，支持身份和表情的解耦，并通过FLAME模型优化实现高精度重建。其应用场景涵盖影视游戏、VR/AR、社交视频、医疗美容和学术研究。

AI项目与工具 2025年06月11日 88 点赞 0 评论 732 浏览

Find3D

Find3D是一款由加州理工学院开发的3D部件分割模型，通过自动化数据生成技术和对比学习方法，实现了高效且精准的3D对象分割。它能够在多个数据集上达到三倍于次优方法的性能提升，支持开放世界下的任意文本查询分割，广泛应用于机器人、虚拟现实、建筑设计等领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 732 浏览

Motion Anything

Motion Anything 是一款由多所高校与企业联合研发的多模态运动生成框架，可基于文本、音乐或两者结合生成高质量人类运动。其核心在于基于注意力的掩码建模和跨模态对齐技术，实现对运动序列的精细控制与动态优先级调整。该工具支持影视动画、VR/AR、游戏开发、人机交互及教育等多个应用场景，并配套提供 Text-Music-Dance (TMD) 数据集，推动多模态运动生成技术的发展。

AI项目与工具 2025年06月12日 23 点赞 0 评论 733 浏览

虚拟

首页

虚拟

列表

默认

浏览次数

发布日期