语音

Talk to Ash

Talk to Ash 是一款基于人工智能的心理健康支持平台,通过语音对话技术提供全天候的情感支持与心理辅导服务。平台结合认知行为疗法(CBT)和辩证行为疗法(DBT)等专业方法,能根据用户对话生成个性化建议。具备语音交互、情绪倾听、目标追踪、隐私保护等功能,适用于压力管理、人际关系改善和个人成长等场景。

麦句

不仅为用户提供了一种新颖的娱乐方式,也为需要情感支持和交流的人提供了一个平台。

酷音

酷音网是一个真人配音与AI配音、视频拍摄与制作、音乐作词与谱曲、视频策划与创意等领域的创作、交易、推广运营于一体的音视频交易服务平台,致力于打造专注音视频领域的商业生态圈。

Audo Studio

Audo AI为创作者和开发人员提供噪声消除产品,包括Audo Studio、Audo API和用于Linux的Magic Mic。这些产品利用音频处理和人工智能的最新进展,自动去除背景噪音,增强音频录制,...

ToucanTTS

一套用于最先进语音合成的工具包,ToucanTTS覆盖超过7,000种语言的大型多语言模型。

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具,基于超10万小时播客数据训练,支持零样本语音合成与说话人适配,可在0.33秒内生成1秒音频,适合实时与长内容合成。支持本地部署与API调用,应用于播客、有声书、视频配音、AI角色及新闻播报等领域,兼具高效性与灵活性。

Avatar AI

人工智能成像模型,可以从你的照片中生成逼真的4K头像。它将方形头像扩展为2:3的4K全尺寸AI照片,并可以将其动画化为带有文本转语音或您自己的声音的AI视频。

Peech

Peech 是一个强大的文本转语音工具,能够轻松地将文本转换成超过50种语言的逼真AI生成音频。

Chinese

Chinese-LiPS是由智源研究院与南开大学联合开发的高质量中文多模态语音识别数据集,包含100小时语音、视频及手动转录文本。其创新性融合唇读视频与幻灯片内容,显著提升语音识别性能,实验表明可降低字符错误率约35%。适用于教学、科普、虚拟讲解等复杂语境,为多模态语音识别研究提供丰富数据支持。

Notta

Notta是由MIND CRUISER LIMITED推出的语音转写软件,主要针对个人使用,并在海外拥有数十万用户。这款软件具有录音实时转写、音/视频导入转写、文本多格式导出、音频标记等功能,...