音频

Rask.ai

Rask.ai平台以其自动化和智能化的翻译及配音服务,帮助企业节省时间和成本,同时提高内容的全球可访问性。

MimicTalk

MimicTalk是一款利用NeRF技术快速生成个性化3D说话人脸模型的工具,其核心功能包括15分钟内完成新身份训练、高质量视频生成、增强的表现力以及上下文学习能力。该工具通过混合适应流程、上下文风格化音频到运动模型等技术,实现了高效的数据样本利用和训练效率提升,适用于虚拟主播、远程协作、VR/AR等领域。

MyEdit

一款在线图片编辑和音频剪辑工具,用户可以使用AI照片编辑器来增强照片、去除人物和文字,甚至生成图像和场景。还提供强大的音频编辑工具,包括文本转语音、语音转文本和背景噪音去除功能。

Huxe AI

Huxe AI是一款基于生成式AI技术的个人音频伴侣应用,旨在为用户提供高度个性化的音频体验。其主要功能包括个性化音频简报、实时问答、减少屏幕时间以及与现有应用的无缝集成。通过连接用户的日历、邮件等数据流,Huxe AI能够生成定制化的语音内容,帮助用户高效管理日程、获取信息并提升学习效率。

FLOAT

FLOAT是一款基于音频驱动的虚拟人像生成模型,利用运动潜在空间和流匹配技术,实现时间一致性视频生成。它支持情感增强,生成自然且富有表现力的虚拟人物,广泛应用于虚拟主播、视频会议、社交媒体、游戏以及电影制作等多个领域,同时具备高效的采样和生成能力。

Koolio.Ai

koolio.ai 是一个基于 Web 平台,可让您在几分钟内将一个概念变成一个完整的播客。

VideoToWords AI

一款免费在线将视频和音频转录为文本的工具,轻松在浏览器中将视频转换为文本,添加字幕等。还提供在线编辑、多种格式导出功能。

Audio

Audio-SDS是由NVIDIA研发的音频处理技术,基于文本提示引导音频生成,支持音效生成、音源分离、FM合成及语音增强等多种任务。该技术无需重新训练模型,即可将预训练音频扩散模型扩展为多功能工具,具备高效推理能力,适用于游戏、音乐制作、教育及智能家居等多个领域。

Noisli

Noisli.com 是一个提供背景噪音和环境声音的平台,旨在帮助用户在工作中保持专注、睡眠和放松。

Speechelo

Speechelo是一款基于先进AI技术的文本转语音工具,支持超过30种性别和语言的声音选择,用户可通过调整语调、速度和音高来自定义语音效果。它兼容主流视频编辑软件,适用于产品演示、教育培训、营销推广等多种场景,助力高效生成高质量语音内容。