AI语音 - 智狐AI导航

Zonos

Zonos是一款由Zyphra开发的高保真文本到语音（TTS）模型，支持零样本语音克隆和多语言生成，具备精细的情感与语音参数控制能力。其采用Transformer和SSM混合架构，基于大规模语音数据训练，适用于有声读物、虚拟助手、多媒体创作及无障碍技术等多个领域。模型开源且支持实时语音生成，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 69 点赞 0 评论 577 浏览

TurboTTS

TurboTTS是一款支持多语言的在线文本转语音工具，提供300多种真实语音选择，生成自然流畅的语音效果。适用于短视频、教育、广告及播客等多种场景，操作简单，支持多种音频格式下载，并可合法用于商业用途。凭借AI技术，用户能高效完成语音内容制作，满足多样化需求。

AI项目与工具 2025年06月12日 20 点赞 0 评论 586 浏览

Speechki

Speechki 是一款高效文本转语音工具，支持多语言和多种语音选择，具备实时校对、角色管理和精准音频控制功能。用户可通过可视化编辑器灵活调整语速、语调和音高，适用于内容创作、教育、企业营销等多种场景。同时支持与 ChatGPT 集成，提升文本转音频的效率和实用性。

AI项目与工具 2025年06月12日 50 点赞 0 评论 641 浏览

Indic Parler

Indic Parler-TTS 是一款由 Hugging Face 与 AI4Bharat 联合开发的多语言文本到语音模型，支持 20 种印度语言和英语，提供 69 种独特语音。该模型基于深度学习架构，通过描述性文本输入实现对音调、语速、情感等参数的灵活控制，适用于多种语音合成场景。在低资源语言上表现优异，具备高自然度和清晰度的语音输出能力。

AI项目与工具 2025年06月12日 55 点赞 0 评论 497 浏览

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型，支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构，具备多语言支持及长文本处理能力，适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本，支持零样本学习，提升语音自然度和表现力。

AI项目与工具 2025年06月12日 71 点赞 0 评论 701 浏览

IndexTTS

IndexTTS 是一款由 B 站开发的高性能文本转语音系统，专注于中文语音合成，支持拼音纠正、精准停顿控制和高自然度语音输出。采用混合建模方法，结合汉字与拼音，提升发音准确性。系统具备零样本语音克隆能力，音质优秀，广泛应用于内容创作、在线教育、智能客服等领域。训练数据丰富，性能指标优异，包括低字词错误率、高扬声器相似性和高主观音质评分。

AI项目与工具 2025年06月12日 15 点赞 0 评论 493 浏览

Scribe

Scribe 是由 ElevenLabs 推出的高精度语音转文本模型，支持 99 种语言，具备多说话者区分、非语言事件检测和单词级时间戳功能。输出结构化的 JSON 数据，适用于会议记录、字幕生成、内容创作等多种场景，广泛应用于教育、客服及媒体领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 655 浏览

All Voice Lab

All Voice Lab是一款基于AI技术的语音创作平台，提供文本转语音、声音克隆、视频翻译、变声等多种功能，支持多语言及多音色转换。平台具备高精度的语音生成能力，可应用于内容创作、视频制作、教育及娱乐等领域，提升内容表现力与国际化传播效率。

AI项目与工具 2025年06月12日 14 点赞 0 评论 718 浏览

Spark

Spark-TTS是一款基于大型语言模型的高效文本转语音工具，支持中英文双语及跨语言合成。它无需额外生成模型，通过LLM预测编码直接生成音频，实现零样本语音克隆。用户可自定义语音参数，如音色、语速等，适用于语音助手、多语言内容创作、智能客服及虚拟角色配音等多种场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 571 浏览

Asyncflow v1.0

Asyncflow v1.0 是一款基于 AI 的文本转语音工具，支持超过 450 种语音选项，涵盖多种语言和风格。通过 Magic Dust AI 技术，实现快速语音克隆与高质量输出，降低训练成本。提供 API 接口，便于开发集成，适用于播客、广告、教育等多种场景，具备高效、易用和高性价比的特点。

AI项目与工具 2025年06月12日 72 点赞 0 评论 658 浏览

AI语音

首页

AI语音

列表

默认

浏览次数

发布日期