语音 - 智狐AI导航

EAP Talk

EAP Talk 是一款基于AI技术的学术英语口语学习工具，提供实时发音、语法和流利度评估，支持多种练习模式如朗读、演讲和情景对话。内置学术场景训练、真人互动及个性化课程，适合高校学生和英语学习者提升口语能力。系统支持词汇练习、学习报告生成和进度跟踪，广泛应用于留学备考、学术研究、国际课堂及职场英语等领域。

AI项目与工具 2025年06月11日 48 点赞 0 评论 795 浏览

Amphion

Amphion是一款开源音频生成工具包，包含文本转语音（TTS）、歌声合成（SVS）、语音转换（VC）、歌声转换（SVC）、文本转音频（TTA）和文本转音乐（TTM）等功能。它支持多种神经声码器，并提供可视化模型架构，帮助用户快速掌握音频生成技术。通过统一框架和预训练模型，Amphion推动了音频生成领域的研究和应用发展。

AI项目与工具 2025年06月12日 63 点赞 0 评论 796 浏览

BANTER AI

BanterAI 是一款基于人工智能技术的创新平台，允许用户与名人、专家及历史人物的虚拟化身进行实时语音对话。其核心功能包括AI克隆体创建、个性化定制、实时互动、数据分析及快速响应，广泛应用于粉丝互动、内容创作、品牌推广、教育培训及娱乐体验等领域。

AI项目与工具 2025年06月12日 25 点赞 0 评论 796 浏览

Avatar IV

Avatar IV 是 HeyGen 推出的 AI 数字人模型，支持用户通过上传照片和语音快速生成逼真视频。该工具基于音频驱动的表情引擎，能精准捕捉语音中的语调、节奏和情感，生成自然流畅的面部表情和动作。操作简单，无需专业技能，适用于多种角色形象，涵盖社交媒体、企业营销、在线教育等多个领域，是高效内容创作的理想选择。

AI项目与工具 2025年06月11日 45 点赞 0 评论 796 浏览

CleanS2S

CleanS2S是一款流式语音到语音交互智能体原型，通过集成自动语音识别（ASR）、大型语言模型（LLM）、文本到语音（TTS）以及WebSockets等技术，提供高质量、实时的语音交互体验。它支持全双工交互和打断功能，可整合网络搜索和RAG模型以增强回答能力，适用于客户服务、智能家居控制、教育辅助、健康咨询及车载系统等多个领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 797 浏览

小饿

小饿是饿了么推出的AI语音助手，专为外卖骑手设计，支持语音交互完成接单、确认到店等操作，提升配送效率。具备权益提醒、天气预警、路线提示、订单热力图及收入预估等功能，覆盖多种配送场景，增强用户体验。已在多个城市上线，适用于蜂鸟众包APP用户。

AI项目与工具 2025年06月11日 12 点赞 0 评论 798 浏览

FakeYou

FakeYou是一个多功能的AI声音生成平台，它通过模拟名人声音，为用户提供了一个创意无限的声音创作工具。

Ai语音工具 2026年06月23日 0 点赞 0 评论 798 浏览

FunASR

FunASR是一个由阿里巴巴达摩院开源的多功能语音识别工具包，涵盖语音识别（ASR）、语音活动检测（VAD）、标点恢复、说话人验证及分离等功能。它支持工业级模型的训练与微调，并提供预训练模型和易用接口，便于快速部署。新增的Whisper-large-v3-turbo模型进一步提升了其性能，广泛应用于智能助手、会议记录、客服系统和语音搜索等领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 799 浏览

DreamActor

DreamActor-M1是字节跳动推出的AI图像动画框架，能够将静态照片转化为高质量动态视频。其核心在于混合引导机制，结合隐式面部表示、3D头球和身体骨架，实现对表情和动作的精准控制。支持多语言语音驱动、口型同步、灵活运动转移及多样化风格适配，适用于虚拟角色创作、个性化动画生成、虚拟主播制作及创意广告等领域，具备高保真、强连贯性和广泛适用性。

AI项目与工具 2025年06月12日 86 点赞 0 评论 800 浏览

蓝心大模型

蓝心大模型是由vivo研发的通用大模型矩阵，包括语言、端侧、语音、图像及多模态模型。该模型在内容创作、知识问答、逻辑推理、代码生成、信息提取、多语言翻译等方面表现出色。蓝心端侧大模型3B在移动设备上表现出色，蓝心语音大模型支持多语言，蓝心图像大模型融合了中国特色和东方美学，蓝心多模态大模型则提供了流畅的视频对话体验。

AI项目与工具 2025年06月12日 76 点赞 0 评论 800 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期