AI语音 - 智狐AI导航

Wispr Flow

Wispr Flow 是一款基于AI技术的语音转文字工具，支持100多种语言，具备自动编辑、上下文感知和低音量识别等功能，提升写作与沟通效率。提供免费基础版及付费专业版和团队版，适用于写作、商务、学习等多种场景，注重用户隐私保护，操作便捷自然。

AI项目与工具 2025年06月12日 79 点赞 0 评论 782 浏览

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI项目与工具 2025年06月12日 97 点赞 0 评论 788 浏览

AI Voice Cloning

一个提供超真实的AI语音克隆生成器，只需要3秒的音频样本就可以克隆英语、普通话、日语、韩语等语言的声音，生成与真人无异的逼真语音。

Ai语音工具 2025年06月05日 17 点赞 0 评论 796 浏览

Whisper

Whisper是一个开源的自动语音识别系统，经过68万小时的多语言和多任务监督数据训练

Ai语音工具 1970年01月01日 0 点赞 0 评论 798 浏览

Dolphin

Dolphin是由清华大学与海天瑞声联合开发的面向东方语言的语音识别大模型，支持40种语言及22种中文方言，具备高精度语音转文字能力。采用CTC-Attention架构，结合E-Branchformer和Transformer技术，提升识别效率与准确性。模型开源，支持自定义语言与地区设置，适用于会议记录、语音输入、智能助手等多种场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 798 浏览

配音神器PRO

配音神器官网_文字转语音神器_配音神器pro_语音合成软件_专业配音神器_AI配音神器

创作工具 1970年01月01日 0 点赞 0 评论 798 浏览

MinMo

MinMo是阿里巴巴通义实验室推出的多模态语音交互大模型，具备高精度语音识别与生成能力。支持情感表达、方言转换、音色模仿及全双工交互，适用于智能客服、教育、医疗等多个领域，提升人机对话的自然度与效率。

AI项目与工具 2025年06月12日 59 点赞 0 评论 805 浏览

VITA

VITA-Audio 是一款开源的端到端多模态语音大模型，具备低延迟、高推理效率和多模态交互能力。其核心创新包括轻量级 MCTP 模块和四阶段渐进式训练策略，使模型在语音识别、文本转语音和口语问答等任务中表现优异。支持实时对话、智能客服、教育辅助、医疗辅助及内容创作等多种应用场景，适用于各类语音交互系统。

AI项目与工具 2025年06月11日 19 点赞 0 评论 825 浏览

SpicyChat

SpicyChat是一款面向成人用户的AI聊天应用，提供角色扮演聊天功能，支持用户与超过150,000个聊天机器人互动，并可创建个性化虚拟角色。该平台强调隐私保护，提供安全、无偏见的环境，支持多语言交流，具备AI语音回应及基于对话的图像生成功能，旨在为用户提供深入的情感体验和创意灵感。

AI项目与工具 2025年06月12日 37 点赞 0 评论 837 浏览

Kokoro

Kokoro-TTS是一款由hexgrad开发的轻量级文本转语音工具，基于StyleTTS 2与ISTFTNet架构，支持多种语音风格和自然语调，具备实时处理能力。支持美式与英式英语，提供10种语音包，适用于教育、游戏、客服等多种场景。支持本地部署与API集成，确保数据安全与高效运行。

AI项目与工具 2025年06月12日 33 点赞 0 评论 854 浏览

AI语音

首页

AI语音

列表

默认

浏览次数

发布日期