AI语音 - 智狐AI导航

Narration Box

Narration Box是一种语音合成服务，用户可以创建画外音、旁白、有声读物、音频页面、播客等。它拥有超过700个人工智能增强的仿人叙述者，支持20多种语言，功能强大的语音编辑器，...

创作工具 1970年01月01日 0 点赞 0 评论 638 浏览

MegaTTS 3

MegaTTS 3是由字节跳动与浙江大学合作开发的零样本文本到语音合成系统，采用轻量级扩散模型，支持中英文及混合语音合成，具备语音克隆、音色控制、韵律调节等功能。系统通过分解语音属性实现精准建模，可快速生成高质量语音，适用于教育、内容制作、语音交互等多个领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 641 浏览

LiSTNR

Listnr是一个人工智能语音生成器和文本到语音的在线工具，允许用户从142种不同语言的900多个声音的文本创建逼真的画外音。

创作工具 1970年01月01日 0 点赞 0 评论 642 浏览

蓝藻AI

运用了尖端的创造性人工智能技术，致力于向用户提供流畅的自然语言处理与生成服务。这涵盖了从文字到语音的转换、语音辨识以及对话管理等多项功能。

创作工具 1970年01月01日 0 点赞 0 评论 647 浏览

voice.ai

voice.ai的使命是通过普及人工智能技术，增强协作创造力，并允许社区重新定义音频表达方式。公司相信人工智能应该是易于接近、对所有人开放且富有趣味的。

创作工具 1970年01月01日 0 点赞 0 评论 648 浏览

All Voice Lab

All Voice Lab是一款基于AI技术的语音创作平台，提供文本转语音、声音克隆、视频翻译、变声等多种功能，支持多语言及多音色转换。平台具备高精度的语音生成能力，可应用于内容创作、视频制作、教育及娱乐等领域，提升内容表现力与国际化传播效率。

AI项目与工具 2025年06月12日 14 点赞 0 评论 652 浏览

ElevenLabs Flash

ElevenLabs Flash是一款专为对话型AI设计的低延迟语音合成模型，支持多种语言，能够以极短的延迟（75毫秒）生成高质量语音，广泛应用于虚拟助手、客户服务、语音播报、教育及娱乐等领域，为用户提供即时反馈和沉浸式体验。该工具以其高效性和灵活性成为超低延迟语音合成领域的领先解决方案。

AI项目与工具 2025年06月12日 68 点赞 0 评论 653 浏览

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别（ASR）模型系列，支持普通话、中文方言和英语，具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本，分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色，且已开源，推动语音识别技术的发展。

AI项目与工具 2025年06月12日 82 点赞 0 评论 655 浏览

WhisperKeyboard

WhisperKeyboard 是一款基于 OpenAI Whisper 技术的 AI 语音输入工具，支持多语言实时语音转文字，适用于写作、编程、会议记录等场景。具备离线识别、文本润色、多语言翻译和隐私保护等功能，兼容多平台，提升输入效率与文本质量。

AI项目与工具 2025年06月12日 76 点赞 0 评论 657 浏览

TTS-Voice-Wizard

TTS语音向导是一种工具，允许用户通过微软Azure语音识别和TTS将语音转换为文本，然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项，包括100...

Ai语音工具 1970年01月01日 0 点赞 0 评论 657 浏览

AI语音

首页

AI语音

列表

默认

浏览次数

发布日期