语音识别 - 智狐AI导航

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI项目与工具 2025年06月12日 97 点赞 0 评论 861 浏览

Mind GPT

Mind GPT-3o是一款由理想汽车推出的大规模多模态端到端人工智能模型，集成了语音、视觉与语言理解技术，具备记忆、规划、工具集成及表达能力。它不仅能理解复杂信息，还能提供个性化服务，如智能驾驶辅助、家居设备控制、日程管理和健康咨询等。通过强化逻辑推理与上下文理解，该模型实现了从感知到表达的智能化跨越，为用户提供全面的支持。

AI项目与工具 2025年06月12日 65 点赞 0 评论 861 浏览

Zeemo.ai

Zeemo，这是一款快速的 AI 字幕工具，可以为您的视频自动生成和翻译字幕。

字幕配音 2025年06月05日 97 点赞 0 评论 866 浏览

Dolphin

Dolphin是由清华大学与海天瑞声联合开发的面向东方语言的语音识别大模型，支持40种语言及22种中文方言，具备高精度语音转文字能力。采用CTC-Attention架构，结合E-Branchformer和Transformer技术，提升识别效率与准确性。模型开源，支持自定义语言与地区设置，适用于会议记录、语音输入、智能助手等多种场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 879 浏览

易途AI面试官

易途AI面试官是一款基于AI技术的模拟面试工具，支持多种岗位和行业，提供真实面试场景、智能追问及多维度评估功能。它能帮助求职者提升面试技巧，同时为企业提高招聘效率和精准度，具备个性化练习与流程优化等特点。

AI项目与工具 2025年06月12日 29 点赞 0 评论 885 浏览

快转字幕

快转字幕，适用于为各种创作者提供字幕制作、学习资源、会议记录、字幕制作等场景，一键为您的视频生成精准的字幕。

Ai语音工具 2025年06月05日 89 点赞 0 评论 888 浏览

本文介绍了15款基于人工智能技术的视频翻译工具，这些工具能够实现精准的语音识别、自然语言处理和机器学习，从而将视频内容从一种语言翻译成另一种语言，为全球观众提供无缝的语言转换体验。这些工具涵盖了多语言支持、精准翻译与文化适配、字幕与音频同步、自动对口型和重新配音、智能视频去文字、翻译视频文字、视频翻译精校版、支持多种语言、字幕调整和声音克隆等多个功能和特点，极大地提升了视频内容的本地化质量和传播效

AI项目与工具 2025年06月12日 52 点赞 0 评论 903 浏览

Whisper

Whisper是一个开源的自动语音识别系统，经过68万小时的多语言和多任务监督数据训练

Ai语音工具 2026年06月23日 0 点赞 0 评论 914 浏览

星火语音同传大模型

星火语音同传大模型是科大讯飞推出的国内首个端到端语音同传AI系统，支持37种语言，具备高精度翻译、流式处理、语境理解和语音合成优化等功能。模型可在5秒内完成同传，准确度高，适用于国际会议、商务交流、教育等场景，支持译文长度调节和设备兼容，提升跨语言沟通效率。

AI项目与工具 2025年06月12日 53 点赞 0 评论 914 浏览

VITA

VITA-Audio 是一款开源的端到端多模态语音大模型，具备低延迟、高推理效率和多模态交互能力。其核心创新包括轻量级 MCTP 模块和四阶段渐进式训练策略，使模型在语音识别、文本转语音和口语问答等任务中表现优异。支持实时对话、智能客服、教育辅助、医疗辅助及内容创作等多种应用场景，适用于各类语音交互系统。

AI项目与工具 2025年06月11日 19 点赞 0 评论 922 浏览

语音识别

首页

语音识别

列表

默认

浏览次数

发布日期