音频 - 智狐AI导航

OmniHuman

OmniHuman是字节跳动推出的多模态人类视频生成框架，基于单张图像和运动信号生成高逼真视频。支持音频、姿势及组合驱动，适用于多种图像比例和风格。采用混合训练策略和扩散变换器架构，提升生成效果与稳定性，广泛应用于影视、游戏、教育、广告等领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 641 浏览

MagicMic

MagicMic是一个功能强大的声音变换工具，适用于游戏玩家、主播和内容创作者。它通过提供丰富的声音过滤器和音效，以及实时声音变换技术，使用户能够在游戏中或在线聊天中保护隐私...

创作工具 2026年06月24日 0 点赞 0 评论 642 浏览

Covers AI

一款功能强大的AI声音和歌曲生成器工具，允许用户使用来自著名主播、政治家、歌手、卡通人物等的数千种声音生成 AI 翻唱。

Ai语音工具 2025年06月05日 82 点赞 0 评论 643 浏览

MyEdit

一款在线图片编辑和音频剪辑工具，用户可以使用AI照片编辑器来增强照片、去除人物和文字，甚至生成图像和场景。还提供强大的音频编辑工具，包括文本转语音、语音转文本和背景噪音去除功能。

图片处理 2025年06月05日 54 点赞 0 评论 646 浏览

MimicTalk

MimicTalk是一款利用NeRF技术快速生成个性化3D说话人脸模型的工具，其核心功能包括15分钟内完成新身份训练、高质量视频生成、增强的表现力以及上下文学习能力。该工具通过混合适应流程、上下文风格化音频到运动模型等技术，实现了高效的数据样本利用和训练效率提升，适用于虚拟主播、远程协作、VR/AR等领域。

AI项目与工具 2025年06月12日 59 点赞 0 评论 646 浏览