音频

T2A

T2A-01-HD是一款支持声音克隆与多语言合成的AI语音模型,可精准还原原声特征与情感表达。具备智能情感系统、多语言支持及高级参数控制功能,适用于有声读物、影视配音、教育、语言学习等多种场景,提供高质量、个性化的语音输出。

Natural Language Playlist

Natural Language Playlist 探索语言和音乐之间丰富而复杂的关系,并使用 Transformer 语言模型构建播放列表。由于没有更好的术语,音乐推荐是一种“闭门造车”的东西。

Text To Speech

构建自然说话的应用和服务,从 147 种语言和变体中选择 456 种语音

OnlineConvertFree

OnlineConvertFree,能转换各种文件、视频、音频和图片格式的在线免费转换软件。

LANDR

LANDR是一款基于人工智能的音乐制作平台,提供从创作到分发的一站式解决方案。它通过AI母带处理优化音质,利用协作平台促进团队合作,借助样本库和插件丰富创作资源,并通过分发网络将作品推向全球市场。此外,LANDR还推出了“公平贸易AI”计划,支持艺术家参与工具开发并分享收益。

入梦AI变声器

入梦AI变声器提供了丰富的声音变化选项,从儿童的高亢声音到成年男性的低沉音调,用户可以根据自己的需求进行选择。

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型,具备约5.15亿参数量,能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出,支持多种应用场景,包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。

AssemblyAI

一个提供将音频文件、视频文件和实时语音转录为文字的平台,提供了一个简单的API,允许用户访问用于转录和语音理解的即可用的AI模型。

Mubert

人类×人工智能生成音乐,对于您的视频内容、播客和应用程序

百度文心歌词生成器

百度文心歌词生成器是百度公司开发的一款基于人工智能技术的创新工具,它利用百度的文心大模型为用户提供快速生成歌词的服务。