虚拟现实 - 智狐AI导航

MovieDreamer

MovieDreamer是一个由浙江大学与阿里巴巴联合开发的AI视频生成框架，专为长视频设计。该框架结合自回归模型和扩散渲染技术，生成复杂的长视频内容。它支持多层次叙事一致性、高质量视觉渲染和多模态脚本，适用于电影预告片、VR叙事、教育视频和游戏内剧情等多种场景。

AI项目与工具 2025年06月12日 34 点赞 0 评论 693 浏览

HelloMeme

HelloMeme是一款基于扩散生成技术的框架，专注于表情与姿态迁移。它利用空间编织注意力机制与Stable Diffusion 1.5模型的结合，生成自然且物理合理的表情包视频，同时具备强大的泛化能力和扩展潜力。HelloMeme通过模块化设计实现了高效的表情和姿态迁移，适用于多种应用场景，如社交媒体内容创作、视频娱乐、电影制作、广告营销及教育培训等。

AI项目与工具 2025年06月12日 91 点赞 0 评论 695 浏览

Being

Being-M0是由北京大学、中国人民大学等机构联合研发的首个大规模人形机器人通用动作生成模型。基于百万级动作数据集 MotionLib 和 MotionBook 编码技术，实现动作序列的高效表示与生成。该模型支持文本驱动动作生成、动作迁移及多模态数据处理，可应用于人形机器人控制、动画制作、VR/AR、人机交互及运动康复等多个领域，显著提升动作生成的多样性和语义对齐精度。

AI项目与工具 2025年06月11日 13 点赞 0 评论 697 浏览

CAT4D

CAT4D是一种由Google DeepMind、哥伦比亚大学及加州大学圣地亚哥分校共同开发的工具，它利用多视图视频扩散模型，从单目视频中生成动态3D（4D）场景表示。该工具可以合成新视图、重建动态3D模型，并支持独立控制相机视点和场景动态，适用于电影制作、游戏开发、虚拟现实等多种领域。

AI项目与工具 2025年06月12日 72 点赞 0 评论 702 浏览

Emu3

Emu3是一款由北京智源人工智能研究院开发的原生多模态世界模型，结合了多模态自回归技术和单一Transformer架构，能够在图像、视频和文本之间实现无缝转换。它不仅能够根据文本生成高质量图像，还能预测视频发展并理解图文内容，广泛应用于内容创作、广告营销、教育、娱乐等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 706 浏览

LCVD

LCVD是一种由四川大学开发的高保真肖像动画生成框架，支持光照可控的动态视频生成。它通过分离肖像的内在与外在特征，并结合多条件分类器自由引导机制，实现对光照和姿态的精细控制。LCVD在图像质量、视频一致性和光照真实感方面表现突出，适用于虚拟现实、视频会议、影视制作及内容创作等多个领域。

AI项目与工具 2025年06月12日 93 点赞 0 评论 707 浏览

DeepFaceLive

DeepFaceLive是一款基于人工智能的面部合成技术，它可以将一个人的面部表情和动作合成到另一个人的脸上，从而实现非常逼真的面部合成效果。

Ai开源项目 2025年06月05日 54 点赞 0 评论 708 浏览

T2I

T2I-R1是由香港中文大学与上海AI Lab联合开发的文本到图像生成模型，采用双层推理机制（语义级和 Token 级 CoT），实现高质量图像生成与复杂场景理解。其基于 BiCoT-GRPO 强化学习框架，结合多专家奖励模型，提升生成图像的多样性和稳定性。适用于创意设计、内容制作、教育辅助等多个领域，具有广泛的应用潜力。

AI项目与工具 2025年06月11日 63 点赞 0 评论 711 浏览

GAS

GAS是一种从单张图像生成高质量、视角一致且时间连贯虚拟形象的AI工具，结合3D人体重建与扩散模型技术，支持多视角合成与动态姿态动画。其统一框架提升模型泛化能力，适用于游戏、影视、体育及时尚等领域，具备高保真度与真实感。

AI项目与工具 2025年06月12日 36 点赞 0 评论 716 浏览

MIDI

MIDI是一种基于多实例扩散模型的3D场景生成技术，能将单张2D图像快速转化为高保真度的360度3D场景。它通过智能分割、多实例同步扩散和注意力机制，实现高效的3D建模与细节优化。具有良好的泛化能力，适用于游戏开发、虚拟现实、室内设计及文物数字化等多个领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 719 浏览

虚拟现实

首页

虚拟现实

列表

默认

浏览次数

发布日期