虚拟 - 智狐AI导航

TrackGo

TrackGo是一种先进的AI视频生成技术，利用自由形状的遮罩和箭头提供精确的运动控制。其核心技术TrackAdapter无缝集成到预训练的视频生成模型中，通过调整时间自注意力层来激活与运动相关的区域。TrackGo在视频质量、图像质量和运动忠实度方面表现出色，适用于影视制作、动画制作、虚拟现实（VR）、增强现实（AR）和游戏开发等多个领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 859 浏览

MVDrag3D

MVDrag3D是一种先进的3D编辑框架，具备多视图一致性编辑、3D高斯重建、视图对齐及视觉质量增强等功能。它能够处理复杂的拓扑变化并支持多样化的3D表示，适用于游戏开发、虚拟现实、增强现实以及计算机辅助设计等领域，展现了强大的生成性和灵活性。

AI项目与工具 2025年06月12日 69 点赞 0 评论 858 浏览

GPT-SoVITS

一个强大的语音合成工具，特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换，支持多种语言，并提供了易于使用的WebUI工具。

Ai平台模型 2026年06月23日 0 点赞 0 评论 857 浏览

AniTalker

AniTalker是一款先进的AI工具，能将单张静态人像与音频同步转化为生动的动画对话视频。它通过自监督学习捕捉面部动态，采用通用运动表示和身份解耦技术减少对标记数据的依赖，同时结合扩散模型和方差适配器生成多样且可控的面部动画。AniTalker支持视频驱动和语音驱动两种方式，并具备实时控制动画生成的能力。

AI项目与工具 2025年06月12日 62 点赞 0 评论 857 浏览

Moshi

Moshi是一款由法国Kyutai实验室开发的端到端实时音频多模态AI模型，具备听、说、看的能力，并能模拟70种不同的情绪和风格进行交流。Moshi具有多模态交互、情绪和风格表达、实时响应低延迟、语音理解与生成、文本和音频混合预训练以及本地设备运行等特点。它支持英语和法语，主要应用于虚拟助手、客户服务、语言学习、内容创作、辅助残障人士、研究和开发、娱乐和游戏等领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 856 浏览

HumanRig

HumanRig是由阿里巴巴团队研发的3D人形角色自动绑定系统，提供大规模高质量数据集和先进算法，支持从粗到细的骨架估计与蒙皮优化。其核心组件包括先验引导骨架估计器（PGSE）和网格-骨架互注意网络（MSMAN），适用于游戏开发、影视制作、VR/AR及数字人应用，有效提升3D角色动画制作效率和质量。

AI项目与工具 2025年06月11日 11 点赞 0 评论 856 浏览

Optimus

Optimus-1是一款由哈尔滨工业大学（深圳）和鹏城实验室联合开发的智能体框架，专为开放世界环境中的长期任务设计。它结合结构化知识与多模态经验，通过混合多模态记忆模块（HDKG与AMEP）提升任务规划与执行能力。主要功能包括知识引导规划、经验驱动反思、行动控制及自我进化，已在游戏、虚拟助理、工业自动化等领域得到验证。

AI项目与工具 2025年06月12日 98 点赞 0 评论 855 浏览

HRAvatar

HRAvatar是由清华大学联合IDEA团队推出的单目视频重建技术，能够从普通单目视频中生成高质量、可重光照的3D头像。它采用可学习的形变基和线性蒙皮技术，结合精确的表情编码器和物理渲染模型，实现高精度重建和实时渲染（约155 FPS）。支持材质编辑、跨视角渲染和动画化，适用于数字人、虚拟主播、AR/VR、游戏开发和影视制作等领域。

AI项目与工具 2025年06月11日 43 点赞 0 评论 855 浏览

MineWorld

MineWorld是由微软研究院开发的基于《我的世界》的实时交互式AI模型，采用视觉-动作自回归Transformer架构，实现高保真、可控性强的场景生成。通过并行解码算法，模型可在每秒4至7帧的速度下实现实时交互，适用于具身智能、强化学习、游戏代理及视频生成等场景。其核心技术包括图像与动作标记器、Transformer解码器以及优化的训练与推理流程。

AI项目与工具 2025年06月11日 93 点赞 0 评论 855 浏览

Dubbing AI

DubbingAI 语音生成器作为实时变声器，可以将任何语音转换为优质语音和克隆语音。从游戏玩家到直播主播和内容创作者。每个人都可以使用 Dubbing AI 生成跨年龄、语言和口音的逼真配音。

Ai语音工具 2025年06月05日 19 点赞 0 评论 854 浏览

虚拟

首页

虚拟

列表

默认

浏览次数

发布日期