语音

通义浏览器插件

通义浏览器插件是一款集实时语音识别、AI字幕翻译、智能总结于一体的多功能AI工具。支持在线课程、会议记录、外语视频观看等多种应用场景,提供语音转文字、翻译、内容总结等功能,帮助用户高效管理在线信息。此外,用户可通过插件快速访问网页版平台,查看和整理记录内容,实现更便捷的信息处理体验。

Resemble AI

Resemble.ai的AI语音生成器是一个完整的生成式语音AI工具包,允许您在几秒钟内创建类似人类的声音。

VideoGen

一款能够在几秒钟内生成高质量、无版权的AI视频生成器。具有逼真AI声音的语音合成引擎、优化的视频编辑器和数百万商用免版税素材,为个人、企业和团队提供了一个快速、简单的视频制作体验。

TEN Agent

TEN Agent 是一款开源的实时多模态 AI 框架,集成了 OpenAI 实时 API 和 RTC 技术,支持语音、文本和图像的多模态交互。它具备天气查询、网络搜索、视觉识别及 RAG 等功能,支持高性能实时通信和模块化扩展,适用于智能客服、语音助手、教育辅助、智能家居控制和健康咨询等多个领域。

AudioBox

Audiobox 是 Meta 推出的 AI 语音和音效工具,结合语音输入和自然语言文字提示词生成语音和音效,例如输入提示词「一条流淌的河流和鸟儿在鸣叫」,Audiobox 自动生成音效。

PengChengStarling

鹏城实验室开源的一款多语言语音识别系统开发工具包,PengChengStarling可以在统一的框架内处理多种语言语音输入,支持实时语音识别,边说边识别。

刺鸟配音

一款专业文字转语音的有情绪的配音软件,刺鸟配音声音媲美真人的AI配音技术,可以为你轻松配出好声音。

OuteTTS

OuteTTS是一款基于开源技术的文本到语音(TTS)工具,利用纯语言建模方法生成自然语音。它支持语音克隆和自定义说话人声音,具备音频标记化、CTC强制对齐和结构化提示创建等功能。OuteTTS与llama.cpp和GGUF格式兼容,适用于有声读物、智能客服、语音导航等多种应用场景。

Article.Audio

Article.Audio是一种允许您将文章转换为高质量的语音的工具。凭借超过140种可用语言和自然流畅的人声,您可以轻松将任何书面内容转换为音频格式。