虚拟

GPT-SoVITS

一个强大的语音合成工具,特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换,支持多种语言,并提供了易于使用的WebUI工具。

冒泡鸭

借助自研的多模态大模型技术,冒泡鸭成为对话AI的新代表。这个先进的系统植入了众多由大模型技术支持的智能对话单元,这些“智能体”旨在提供用户所需的信息和灵感,不仅解答疑问,...

Dubbing AI

DubbingAI 语音生成器作为实时变声器,可以将任何语音转换为优质语音和克隆语音。从游戏玩家到直播主播和内容创作者。每个人都可以使用 Dubbing AI 生成跨年龄、语言和口音的逼真配音。

创视元数字人

创视元通过其简单易用的界面和先进的AI技术,使得数字人视频创作变得快速、便捷。无论是企业宣传、教育培训还是其他应用场景,创视元都能提供高效的解决方案。

EliGen

EliGen是由浙江大学与阿里巴巴集团联合开发的实体级可控图像生成框架,采用区域注意力机制实现对图像中实体的精确控制,支持多实体修复、风格化生成及交互式编辑。基于50万高质量注释样本训练,具备强大泛化能力,适用于虚拟场景、角色设计、数据合成及产品展示等场景。

OpenUtau

OpenUtau 是一款开源的歌声合成工具,支持 UTAU 音源库和 VSQX 格式,具备音素编辑、颤音控制、多语言界面等功能,适用于音乐创作与虚拟歌手合成。它兼容 Windows、macOS 和 Linux,提供预渲染与实时预览,提升创作效率,适合音乐人、开发者及音频爱好者使用。

HRAvatar

HRAvatar是由清华大学联合IDEA团队推出的单目视频重建技术,能够从普通单目视频中生成高质量、可重光照的3D头像。它采用可学习的形变基和线性蒙皮技术,结合精确的表情编码器和物理渲染模型,实现高精度重建和实时渲染(约155 FPS)。支持材质编辑、跨视角渲染和动画化,适用于数字人、虚拟主播、AR/VR、游戏开发和影视制作等领域。

魔珐科技

魔珐科技致力于为三维虚拟内容制作提供智能化、工业化的基础设施;为虚拟世界提供造人、育人、用人的全栈式技术和产品服务,打造虚拟世界基础设施平台。

UNO

UNO是字节跳动推出的AI图像生成框架,支持单主体和多主体图像生成,解决多主体一致性难题。采用扩散变换器和渐进式跨模态对齐技术,结合通用旋转位置嵌入(UnoPE),实现高一致性与可控性。适用于虚拟试穿、产品设计、创意设计等多个领域,具备强大泛化能力,已开源并提供完整技术文档。

MVDrag3D

MVDrag3D是一种先进的3D编辑框架,具备多视图一致性编辑、3D高斯重建、视图对齐及视觉质量增强等功能。它能够处理复杂的拓扑变化并支持多样化的3D表示,适用于游戏开发、虚拟现实、增强现实以及计算机辅助设计等领域,展现了强大的生成性和灵活性。