语音识别 - 智狐AI导航

小爱同学AI助手

由小米公司研发，基于小米的硬件生态和海量数据，为用户提供全球领先的语音识别、NLP等完整的 AI 技术服务。

AI写作对话 2025年06月05日 90 点赞 0 评论 544 浏览

通义浏览器插件

通义浏览器插件是一款集实时语音识别、AI字幕翻译、智能总结于一体的多功能AI工具。支持在线课程、会议记录、外语视频观看等多种应用场景，提供语音转文字、翻译、内容总结等功能，帮助用户高效管理在线信息。此外，用户可通过插件快速访问网页版平台，查看和整理记录内容，实现更便捷的信息处理体验。

AI项目与工具 2025年06月12日 84 点赞 0 评论 541 浏览

PengChengStarling

鹏城实验室开源的一款多语言语音识别系统开发工具包，PengChengStarling可以在统一的框架内处理多种语言语音输入，支持实时语音识别，边说边识别。

Ai语音工具 2025年06月05日 66 点赞 0 评论 536 浏览

AI酱

AI酱是一款结合二次元元素与AI技术的多语言智能聊天工具，支持多种语言交流，具备语音识别和即时反馈功能。它通过生动的角色形象和标准化发音，帮助用户练习外语口语，并能在情绪疏导、旅行规划等方面提供个性化服务。此外，其多角色设定和场景切换功能进一步增强了用户体验。

AI项目与工具 2025年06月12日 37 点赞 0 评论 534 浏览

Chinese

Chinese-LiPS是由智源研究院与南开大学联合开发的高质量中文多模态语音识别数据集，包含100小时语音、视频及手动转录文本。其创新性融合唇读视频与幻灯片内容，显著提升语音识别性能，实验表明可降低字符错误率约35%。适用于教学、科普、虚拟讲解等复杂语境，为多模态语音识别研究提供丰富数据支持。

AI项目与工具 2025年06月11日 47 点赞 0 评论 530 浏览

Notta

Notta是由MIND CRUISER LIMITED推出的语音转写软件，主要针对个人使用，并在海外拥有数十万用户。这款软件具有录音实时转写、音/视频导入转写、文本多格式导出、音频标记等功能，...

Ai办公效率 2026年06月23日 0 点赞 0 评论 526 浏览

Tailor

Tailor是一款免费开源的AI视频编辑工具，提供视频编辑、生成和优化三大功能。它能够实现人脸剪辑、语音剪辑、口播生成、字幕生成、色彩生成等功能，并支持背景更换及流畅度和清晰度优化。最新版本增加了语音驱动的口播生成和模型自检修复机制，进一步提升了用户体验。

AI项目与工具 2025年06月12日 79 点赞 0 评论 518 浏览

Speech Studio

Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法，可以访问诸如实时语音到文本、自定义语音识别模型、发...

Ai语音工具 2026年06月23日 0 点赞 0 评论 515 浏览

Hertz

Hertz-Dev是一款由Standard Intelligence开发的开源音频模型，专注于低延迟实时对话AI。它具备强大的音频生成与处理能力，能够处理和生成高质量的音频信号，并支持多任务微调，适用于语音识别、语音合成等多种应用场景。此外，Hertz-Dev还提供了音频自动编码、流式生成等功能，广泛应用于智能助手、客户服务、语音识别及合成等领域。

AI项目与工具 2025年06月12日 48 点赞 0 评论 496 浏览

Faster Whisper

Faster Whisper 是一款基于 OpenAI Whisper 模型的高效语音识别工具，利用 CTranslate2 引擎显著提升转写速度并降低内存消耗。它支持多语言处理，可应用于实时语音转写、视频字幕生成、客户服务、医疗记录等领域。其核心技术包括 8 位量化、语音活动检测（VAD）及模型优化，同时提供灵活的 API 接口供开发者集成。

AI项目与工具 2025年06月12日 30 点赞 0 评论 494 浏览

语音识别

首页

语音识别

列表

默认

浏览次数

发布日期