AI语音

首页

AI语音

列表

默认

浏览次数

发布日期

WhisperKeyboard

WhisperKeyboard

WhisperKeyboard 是一款基于 OpenAI Whisper 技术的 AI 语音输入工具，支持多语言实时语音转文字，适用于写作、编程、会议记录等场景。具备离线识别、文本润色、多语言翻译和隐私保护等功能，兼容多平台，提升输入效率与文本质量。

AI项目与工具 2025年06月12日 76 点赞 0 评论 745 浏览

FireRedASR

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别（ASR）模型系列，支持普通话、中文方言和英语，具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本，分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色，且已开源，推动语音识别技术的发展。

AI项目与工具 2025年06月12日 82 点赞 0 评论 741 浏览

TTS-Voice-Wizard

TTS-Voice-Wizard

TTS语音向导是一种工具，允许用户通过微软Azure语音识别和TTS将语音转换为文本，然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项，包括100...

Ai语音工具 2026年06月23日 0 点赞 0 评论 737 浏览

Chat Video

Chat Video

Chat Video 基于AI的高效视频学习工具，具有语音识别、摘要总结、AI 问答等功能。

视频剪辑 2025年06月05日 25 点赞 0 评论 733 浏览

蓝藻AI

蓝藻AI

运用了尖端的创造性人工智能技术，致力于向用户提供流畅的自然语言处理与生成服务。这涵盖了从文字到语音的转换、语音辨识以及对话管理等多项功能。

创作工具 2026年06月23日 0 点赞 0 评论 721 浏览

All Voice Lab

All Voice Lab

All Voice Lab是一款基于AI技术的语音创作平台，提供文本转语音、声音克隆、视频翻译、变声等多种功能，支持多语言及多音色转换。平台具备高精度的语音生成能力，可应用于内容创作、视频制作、教育及娱乐等领域，提升内容表现力与国际化传播效率。

AI项目与工具 2025年06月12日 14 点赞 0 评论 719 浏览

Text to Bark

Text to Bark

Text to Bark 是由 ElevenLabs 推出的全球首个 AI 狗语文本转语音模型，能将文字转化为高度逼真的狗吠声，支持多种犬种选择和语气调整。技术基于深度学习和犬类语言学研究，适用于宠物训练、科研、娱乐及家庭互动等多种场景，具备良好的可扩展性和实用性。

AI项目与工具 2025年06月12日 47 点赞 0 评论 717 浏览

ElevenLabs Flash

ElevenLabs Flash

ElevenLabs Flash是一款专为对话型AI设计的低延迟语音合成模型，支持多种语言，能够以极短的延迟（75毫秒）生成高质量语音，广泛应用于虚拟助手、客户服务、语音播报、教育及娱乐等领域，为用户提供即时反馈和沉浸式体验。该工具以其高效性和灵活性成为超低延迟语音合成领域的领先解决方案。

AI项目与工具 2025年06月12日 68 点赞 0 评论 717 浏览

MegaTTS 3

MegaTTS 3

MegaTTS 3是由字节跳动与浙江大学合作开发的零样本文本到语音合成系统，采用轻量级扩散模型，支持中英文及混合语音合成，具备语音克隆、音色控制、韵律调节等功能。系统通过分解语音属性实现精准建模，可快速生成高质量语音，适用于教育、内容制作、语音交互等多个领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 713 浏览

Narration Box

Narration Box

Narration Box是一种语音合成服务，用户可以创建画外音、旁白、有声读物、音频页面、播客等。它拥有超过700个人工智能增强的仿人叙述者，支持20多种语言，功能强大的语音编辑器，...

创作工具 2026年06月23日 0 点赞 0 评论 712 浏览

微信公众账号

微信扫一扫加关注