文本转语音

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型，支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构，具备多语言支持及长文本处理能力，适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本，支持零样本学习，提升语音自然度和表现力。

AI项目与工具 2025年06月12日 71 点赞 0 评论 627 浏览

OCTAVE

OCTAVE是一款由Hume AI研发的语音语言处理工具，融合了多种领先AI技术，具备强大的个性化语音生成能力，支持从文字到语音的即时转化，并能精准模仿不同说话者的声线与情感表达。其主要功能包括多角色对话生成、复杂指令理解与响应，以及实时语音处理等。此外，OCTAVE可应用于客户服务、虚拟助手、教育培训、娱乐游戏等多个领域，为用户带来更加自然、生动的交互体验。

AI项目与工具 2025年06月12日 14 点赞 0 评论 629 浏览

Spiritme AI

一款AI视频平台，可以让用户通过数字化化身生成个性化视频。该平台利用人工智能技术，帮助用户轻松创建独特和引人入胜的视频。

Ai视频生成 2025年06月05日 30 点赞 0 评论 630 浏览

大饼AI变声

大饼AI变声，自然人声效果，千种音色选择，全场景接入支持，专注于声音领域，除了实时变声，大饼AI变声还为声音从业者打造了音色转换工具，为内容创作者提供了文本转语音等功能。

Ai语音工具 2025年06月05日 47 点赞 0 评论 633 浏览

Text to Bark

Text to Bark 是由 ElevenLabs 推出的全球首个 AI 狗语文本转语音模型，能将文字转化为高度逼真的狗吠声，支持多种犬种选择和语气调整。技术基于深度学习和犬类语言学研究，适用于宠物训练、科研、娱乐及家庭互动等多种场景，具备良好的可扩展性和实用性。

AI项目与工具 2025年06月12日 47 点赞 0 评论 638 浏览

All Voice Lab

All Voice Lab是一款基于AI技术的语音创作平台，提供文本转语音、声音克隆、视频翻译、变声等多种功能，支持多语言及多音色转换。平台具备高精度的语音生成能力，可应用于内容创作、视频制作、教育及娱乐等领域，提升内容表现力与国际化传播效率。

AI项目与工具 2025年06月12日 14 点赞 0 评论 652 浏览

EmotiVoice

EmotiVoice是网易有道推出的开源文本到语音系统，支持中英文及2000+音色，能根据提示生成带情感的语音。具备情感合成、语音克隆、多语言支持等功能，提供Web界面和API接口，适用于有声读物、智能助手、教育、客服等场景，技术上支持高效部署与模型微调。

AI项目与工具 2025年06月12日 30 点赞 0 评论 658 浏览

声动视界SoundView

一款面向带货短视频的AI视频工具，声动视界SoundView提供视频翻译、文本转语音和视频配音等功能。

Ai语音工具 2025年06月05日 58 点赞 0 评论 659 浏览

KAPWING

KAPWING是一款基于AI技术的在线视频编辑平台，提供从视频生成到编辑的一站式解决方案。其核心功能涵盖AI视频生成器、文档转视频、文本转语音、字幕生成及高级编辑工具，支持用户轻松创建和定制视频内容。此外，KAPWING还具备团队协作能力，适合教育、企业宣传及内容创作等多个应用场景。

AI项目与工具 2025年06月12日 14 点赞 0 评论 661 浏览

NeMo

NeMo 是一款基于 NVIDIA 技术的端到端云原生框架，专为生成式 AI 模型的设计与部署而打造。它具备模块化架构、多模态支持、优化算法及分布式训练能力，可应用于语音识别、自然语言处理、文本到语音转换、对话式 AI 等多个领域，同时支持预训练模型微调和端到端开发流程，为企业提供高效灵活的解决方案。

AI项目与工具 2025年06月12日 38 点赞 0 评论 663 浏览

文本转语音

首页

文本转语音

列表

默认

浏览次数

发布日期