虚拟 - 智狐AI导航

WorldCraft

WorldCraft是一款基于大型语言模型的3D世界创建系统，支持用户通过自然语言交互快速生成和调整虚拟场景。其核心模块包括物体定制、场景布局优化和轨迹控制，具备高精度的几何与纹理控制能力。系统兼容多种3D生成工具，适用于建筑设计、影视娱乐、教育等多个领域，为非专业人士提供高效、直观的创意设计解决方案。

AI项目与工具 2025年06月12日 80 点赞 0 评论 744 浏览

xAR

xAR是由字节跳动与约翰·霍普金斯大学联合研发的自回归视觉生成框架，采用“下一个X预测”和“噪声上下文学习”技术，提升视觉生成的准确性和效率。其支持多种预测单元，具备高性能生成能力，在ImageNet数据集上表现优异，适用于艺术创作、虚拟场景生成、老照片修复、视频内容生成及数据增强等多种应用场景。

AI项目与工具 2025年06月12日 30 点赞 0 评论 547 浏览

Avat3r

Avat3r 是由慕尼黑工业大学与 Meta Reality Labs 联合开发的高保真三维头部头像生成模型，基于高斯重建技术，仅需少量输入图像即可生成高质量且可动画化的 3D 头像。其核心优势在于使用交叉注意力机制实现表情动态化，支持多源输入，具备良好的鲁棒性和泛化能力。适用于 VR/AR、影视制作、游戏开发及数字人等领域。

AI项目与工具 2025年06月12日 69 点赞 0 评论 665 浏览

ARTalk

ARTalk是由东京大学与日本理化学研究所联合开发的语音驱动3D头部动画生成框架，基于自回归模型实现实时、高同步性的唇部动作和自然表情生成。它通过多尺度运动码本和滑动时间窗口技术提升动画质量，并引入风格编码器实现个性化风格适配。该工具在唇部同步、表情自然性和风格一致性方面优于现有技术，适用于虚拟现实、游戏开发、动画制作及人机交互等领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 974 浏览

Spark

Spark-TTS是一款基于大型语言模型的高效文本转语音工具，支持中英文双语及跨语言合成。它无需额外生成模型，通过LLM预测编码直接生成音频，实现零样本语音克隆。用户可自定义语音参数，如音色、语速等，适用于语音助手、多语言内容创作、智能客服及虚拟角色配音等多种场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 572 浏览

LCVD

LCVD是一种由四川大学开发的高保真肖像动画生成框架，支持光照可控的动态视频生成。它通过分离肖像的内在与外在特征，并结合多条件分类器自由引导机制，实现对光照和姿态的精细控制。LCVD在图像质量、视频一致性和光照真实感方面表现突出，适用于虚拟现实、视频会议、影视制作及内容创作等多个领域。

AI项目与工具 2025年06月12日 93 点赞 0 评论 708 浏览

HeyReal

HeyReal 是一款基于 AI 技术的虚拟角色互动平台，支持用户自定义角色外观、性格和背景，提供自然流畅的对话体验。平台涵盖多种角色类型，支持多语言模型，并注重隐私保护，适用于社交陪伴、角色扮演、创意写作及语言学习等场景。

AI项目与工具 2025年06月12日 23 点赞 0 评论 601 浏览

BuzzClip

BuzzClip 是一款基于人工智能的视频生成工具，专注于帮助用户在短时间内高效制作适合 TikTok 等平台的短视频内容。平台提供超过 100 个 AI 虚拟形象、多种预设模板及多语言支持，适用于品牌推广、产品展示和社交媒体运营等多种场景。用户可直接发布视频并进行品牌定制，具备完整的商业使用权和基础数据分析功能，提升内容创作效率与传播效果。

AI项目与工具 2025年06月12日 60 点赞 0 评论 503 浏览

Kiss3DGen

Kiss3DGen是一款基于2D扩散模型的3D资产生成框架，通过“3D Bundle Image”结构实现多视角图像与法线图的融合，从而高效生成和编辑3D模型。它支持文本与图像输入，具备3D编辑、网格优化和纹理增强等功能，适用于游戏开发、影视制作、VR/AR、数字孪生及教育等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 838 浏览

GCDance

GCDance是一款由英国萨里大学与江南大学联合开发的3D舞蹈生成框架，可根据音乐和文本提示生成风格可控的全身舞蹈序列。它结合多粒度音乐特征融合与CLIP模型文本嵌入技术，实现舞蹈动作与音乐节奏的高度同步。支持多种舞蹈风格生成、局部编辑及高质量全身动作输出，适用于VR、游戏开发、舞蹈教学等场景。

AI项目与工具 2025年06月12日 36 点赞 0 评论 778 浏览

虚拟

首页

虚拟

列表

默认

浏览次数

发布日期