语音识别 - 智狐AI导航

TEN VAD

TEN VAD是一款高性能的实时语音活动检测系统，专为企业级应用设计。它基于深度学习技术，能够精确区分语音和非语音信号，具有低延迟、轻量级和高精度的特点。支持多种平台和编程接口，适用于智能助手、客服机器人等场景，帮助构建更高效、更智能的对话系统。

AI项目与工具 2025年06月11日 47 点赞 0 评论 686 浏览

Videotoword.ai

Videotoword.ai 是一款以AI驱动的在线服务，支持将音频和视频文件转化为文本，具有高精度（99.9%）和多语言支持（98种以上）。它能处理长达10小时的文件，具备自动转录、文本编辑导出及AI摘要生成功能，广泛应用于教育、媒体、法律和企业等领域。

AI项目与工具 2025年06月12日 36 点赞 0 评论 684 浏览

adobe.podcast

AI驱动的音频增强语音通过消...

Ai语音工具 2026年06月23日 0 点赞 0 评论 682 浏览

讯飞译制

讯飞译制是一款基于语音识别与机器翻译技术的智能字幕制作与翻译平台，支持多语言转换与自动字幕生成，提供高精度识别、智能时间码匹配、多格式导出及配音功能，适用于短视频出海、教学视频、广告宣传等多种场景，提升内容传播效率与国际化水平。

AI项目与工具 2025年06月11日 81 点赞 0 评论 674 浏览

BoldVoice

BoldVoice 是一款专注于英语发音训练的工具，结合专业口音课程与AI语音分析技术，帮助非英语母语者提升发音准确性和口语自信。用户可通过录音获得实时反馈与改进建议，并根据个人母语背景定制学习计划。应用还提供发音测试、口音对比和多场景练习功能，适用于职场、考试、日常交流及表演等领域，有效提升英语口语能力。

AI项目与工具 2025年06月12日 100 点赞 0 评论 672 浏览

SeniorTalk

SeniorTalk是全球首个面向中文超高龄老年人的语音数据集，涵盖202位75岁以上老人的55.53小时语音数据，覆盖16个省市，包含多种口音。数据通过两两自发对话采集，内容贴近真实交流场景，并附有多维标注，如说话人信息、时间戳、口音分类等。该数据集可用于语音识别、说话人验证、语音编辑等研究，支持适老化设备、健康管理和辅助养老系统的开发，推动相关技术进步。

AI项目与工具 2025年06月12日 71 点赞 0 评论 671 浏览