Fish Speech 1.5

简介：Fish Speech 1.5是一款基于深度学习的文本转语音（TTS）工具，支持多语言文本输入，通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力，延迟时间短，无需依赖音素，泛化性强，且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

AI小编 695 阅读 0 评论 14 点赞

项目地址

Fish Speech 1.5是由Fish Audio开发的一款基于深度学习的文本转语音（TTS）模型，采用了Transformer、VITS、VQVAE和GPT等多种先进技术。该模型支持包括英语、日语、韩语和中文在内的13种语言，具备零样本和少样本语音合成能力，仅需10到30秒的声音样本即可生成高质量的语音模仿效果，语音克隆功能的延迟时间低于150毫秒。Fish Speech 1.5具备强大的泛化能力，无需依赖音素，能够处理任意语言脚本。未来还将推出实时无缝对话功能，方便用户随时进行交互式交流。该模型开源了预训练版本，并支持本地部署，兼容Linux、Windows和macOS系统。

本文分类：AI项目与工具
本文标签：文本转语音 TTS 深度学习 Transformer VITS VQVAE GPT 多语言支持实时合成开源工具
浏览次数：695 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://tools.sihangdaima.com/AIxiangmuyugongju/9997.html

上一篇 > Star
下一篇 > Motion Prompting

评论列表共有 0 条评论

暂无评论

Fish Speech 1.5

ChatTTS

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复