AI语音 - 智狐AI导航

Steve AI

Steve AI 是一款基于人工智能技术的云端视频生成平台，支持文本、博客、网页或音频内容转化为高质量视频和动画。它提供文本到视频、AI语音到视频、动画AI头像视频等多种功能，拥有超过300个AI头像及庞大的媒体库，同时配备40多种视频编辑工具。用户无需专业技能即可快速制作出专业级视频内容，广泛适用于社交媒体营销、教育培训、企业培训、内容营销和个人品牌建设等领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 959 浏览

Kokoro

Kokoro-TTS是一款由hexgrad开发的轻量级文本转语音工具，基于StyleTTS 2与ISTFTNet架构，支持多种语音风格和自然语调，具备实时处理能力。支持美式与英式英语，提供10种语音包，适用于教育、游戏、客服等多种场景。支持本地部署与API集成，确保数据安全与高效运行。

AI项目与工具 2025年06月12日 33 点赞 0 评论 937 浏览

VITA

VITA-Audio 是一款开源的端到端多模态语音大模型，具备低延迟、高推理效率和多模态交互能力。其核心创新包括轻量级 MCTP 模块和四阶段渐进式训练策略，使模型在语音识别、文本转语音和口语问答等任务中表现优异。支持实时对话、智能客服、教育辅助、医疗辅助及内容创作等多种应用场景，适用于各类语音交互系统。

AI项目与工具 2025年06月11日 19 点赞 0 评论 922 浏览

SpicyChat

SpicyChat是一款面向成人用户的AI聊天应用，提供角色扮演聊天功能，支持用户与超过150,000个聊天机器人互动，并可创建个性化虚拟角色。该平台强调隐私保护，提供安全、无偏见的环境，支持多语言交流，具备AI语音回应及基于对话的图像生成功能，旨在为用户提供深入的情感体验和创意灵感。

AI项目与工具 2025年06月12日 37 点赞 0 评论 917 浏览

Whisper

Whisper是一个开源的自动语音识别系统，经过68万小时的多语言和多任务监督数据训练

Ai语音工具 2026年06月23日 0 点赞 0 评论 914 浏览

MinMo

MinMo是阿里巴巴通义实验室推出的多模态语音交互大模型，具备高精度语音识别与生成能力。支持情感表达、方言转换、音色模仿及全双工交互，适用于智能客服、教育、医疗等多个领域，提升人机对话的自然度与效率。

AI项目与工具 2025年06月12日 59 点赞 0 评论 884 浏览

Dolphin

Dolphin是由清华大学与海天瑞声联合开发的面向东方语言的语音识别大模型，支持40种语言及22种中文方言，具备高精度语音转文字能力。采用CTC-Attention架构，结合E-Branchformer和Transformer技术，提升识别效率与准确性。模型开源，支持自定义语言与地区设置，适用于会议记录、语音输入、智能助手等多种场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 879 浏览

Wispr Flow

Wispr Flow 是一款基于AI技术的语音转文字工具，支持100多种语言，具备自动编辑、上下文感知和低音量识别等功能，提升写作与沟通效率。提供免费基础版及付费专业版和团队版，适用于写作、商务、学习等多种场景，注重用户隐私保护，操作便捷自然。

AI项目与工具 2025年06月12日 79 点赞 0 评论 877 浏览

AI Voice Cloning

一个提供超真实的AI语音克隆生成器，只需要3秒的音频样本就可以克隆英语、普通话、日语、韩语等语言的声音，生成与真人无异的逼真语音。

Ai语音工具 2025年06月05日 17 点赞 0 评论 863 浏览

VALL-E

VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说，我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型（称为 VALL-E），并将 TTS 视为...

Ai平台模型 2026年06月23日 0 点赞 0 评论 862 浏览

AI语音

首页

AI语音

列表

默认

浏览次数

发布日期