文本转语音

MARS5

MARS5-TTS是一款开源的AI声音克隆工具，支持140多种语言的文本转语音功能。它能够生成高度逼真的语音，并处理复杂的韵律场景。该工具拥有12亿参数，基于超过15万小时的训练数据。用户可以通过文本中的标点符号和大小写等标记引导语音的韵律和情感，同时提供快速克隆和深度克隆两种模式。MARS5-TTS可应用于内容创作、语言学习、辅助技术、客户服务和多媒体娱乐等多种场景。

AI项目与工具 2025年06月12日 53 点赞 0 评论 483 浏览

Voxify

Voxify是一款利用AI技术将文本转化为自然语音的专业工具，具备超过450种声音选择，支持140多种语言和方言。用户可自定义音调、语速及情感表达，满足多样化的应用场景。此外，Voxify支持多格式输出并提供API接口，便于集成至其他系统中。

AI项目与工具 2025年06月12日 82 点赞 0 评论 484 浏览

声咔AI配音

声咔AI配音是在线配音软件平台，垂直深度音频效率工具，支持30多种个性化调音功能等，限制少对用户友好。

创作工具 1970年01月01日 0 点赞 0 评论 485 浏览

Spark

Spark-TTS是一款基于大型语言模型的高效文本转语音工具，支持中英文双语及跨语言合成。它无需额外生成模型，通过LLM预测编码直接生成音频，实现零样本语音克隆。用户可自定义语音参数，如音色、语速等，适用于语音助手、多语言内容创作、智能客服及虚拟角色配音等多种场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 490 浏览

Nova A.I.

一款简单却强大的在线视频编辑和日志软件，由计算机视觉视频搜索引擎提供支持。

视频剪辑 2025年06月05日 25 点赞 0 评论 495 浏览

Zonos

Zonos是一款由Zyphra开发的高保真文本到语音（TTS）模型，支持零样本语音克隆和多语言生成，具备精细的情感与语音参数控制能力。其采用Transformer和SSM混合架构，基于大规模语音数据训练，适用于有声读物、虚拟助手、多媒体创作及无障碍技术等多个领域。模型开源且支持实时语音生成，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 69 点赞 0 评论 503 浏览