语音

星声AI播客

专注于AI播客领域的AI播客生成器,面向广大播客爱好者和音频内容分享使用者。

VoicePanel

一个利用AI进行语音或视频采访的平台,Voicepanel 的 AI 可以招募您的目标受众,通过语音或视频进行采访,并立即合成可操作的见解总结。

Text To Speech

构建自然说话的应用和服务,从 147 种语言和变体中选择 456 种语音

Chatterbox

Chatterbox是Resemble AI推出的开源文本转语音(TTS)模型,基于0.5B规模的LLaMA架构,用超过50万小时精选音频训练。它支持零样本语音克隆,仅需5秒参考音频即可生成高度逼真的个性化语音,并具备情感夸张控制功能,可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力,延迟低至200毫秒以下,适用于交互式应用。此外,它采用安全水印技术防止滥用,适用于内容

蘑兔听记

一款音视频转文字工具,超98%的语音识别准确率,30分钟音频只需3分钟就可转成文字,支持20多种方言、30余种外语,极大提高了工作和学习效率。

声动视界

SoundView是一款面向带货短视频的AI工具,提供视频翻译、文本转语音及视频配音等服务,支持100多种语言,能有效提升视频完播率和客户咨询率,同时具备音色模仿功能,助力用户优化素材复用。主要应用于跨境电商、社交媒体营销、教育培训、企业宣传及旅游业等领域。

ListenHub

ListenHub 是一款基于 AI 技术的播客生成工具,支持中英文内容处理,可快速生成高质量播客。它能自动生成主题、脚本,并提供超真实人声体验。用户可自定义角色、编辑音频并一键发布至多个平台,适用于个人创作、知识分享和娱乐休闲等多种场景。

AssemblyAI

一个提供将音频文件、视频文件和实时语音转录为文字的平台,提供了一个简单的API,允许用户访问用于转录和语音理解的即可用的AI模型。

蜜小语

蜜小语是一款专注于提升聊天体验的移动应用,提供蜜语键盘、聊天标签和热度调节等功能,帮助用户在恋爱、职场、朋友聚会及网络社交中更自然流畅地交流。其标签库涵盖多种场景,并支持自定义设置,增强个性化表达。用户可通过订阅服务获取更多高级功能。

T2A

T2A-01-HD是一款支持声音克隆与多语言合成的AI语音模型,可精准还原原声特征与情感表达。具备智能情感系统、多语言支持及高级参数控制功能,适用于有声读物、影视配音、教育、语言学习等多种场景,提供高质量、个性化的语音输出。