语音识别 - 智狐AI导航

白瓜面试

白瓜面试是一款集智能回答、代码解析、语音与图像识别于一体的AI面试辅助工具。它通过实时语音转录、图片分析及物理隔离功能，帮助求职者在技术面试和技术岗位应聘中保持高效表现。此外，它还支持在线面试、笔试优化及简历定制服务，旨在全面提升用户的面试体验。

AI项目与工具 2025年06月12日 53 点赞 0 评论 657 浏览

OfferinAI

OfferinAI是一款面向求职者和招聘者的智能工具，集成了实时语音识别、快速响应、网络搜索及代码生成等功能，旨在提升用户在面试和笔试中的表现。它支持多种模式，适用于在线面试、笔试辅助、技能测试及模拟面试等场景，帮助用户在多轮面试中获得竞争优势。

AI项目与工具 2025年06月12日 100 点赞 0 评论 655 浏览

Linly

一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。

Ai开源项目 2025年06月05日 38 点赞 0 评论 654 浏览

VAPI

VAPI是一个面向开发者的语音AI平台，凭借其简便的API集成、高精度语音识别、多语言支持以及定制化能力，能够协助开发者快速将语音技术嵌入至不同类型的软件应用中。它注重数据隐私与安全性，并提供多样化的应用场景，如智能助手、客户服务自动化、教育培训、医疗健康及呼叫中心等，帮助企业提升运营效率和服务质量。

AI项目与工具 2025年06月12日 91 点赞 0 评论 654 浏览

海豚配音

一款集逼真效果、丰富音色和细腻情感于一体的全能AI配音平台。拥有超过500种栩栩如生的真人音色和1000多种独具特色的二次元音色。

字幕配音 2025年06月05日 35 点赞 0 评论 652 浏览

WhisperChain

WhisperChain 是一款开源语音识别工具，支持实时语音转文本并提供文本优化功能，可去除填充词、优化语法。用户可通过全局热键快速启动语音输入，处理结果自动复制到剪贴板。支持 Streamlit 界面与 FastAPI 架构，适用于会议记录、写作辅助等场景。

AI项目与工具 2025年06月12日 57 点赞 0 评论 650 浏览

讯飞听见字幕

一款基于科大讯飞语音识别技术的AI视频字幕制作软件，提供视频加字幕、自动添加字幕、视频翻译等。

字幕配音 2025年06月05日 67 点赞 0 评论 642 浏览

CapsWriter

CapsWriter-Offline是一款基于PC端的离线语音输入与字幕转录工具，支持实时语音转文字功能，具备高准确率和无限时长录音能力。其核心技术依托于深度学习模型，可处理中英文混合语音，并提供热词自定义功能以提升特定术语的识别效果。此工具适用于会议记录、学术讲座、视频字幕生成等多种场景，同时确保用户数据的安全与隐私。 ---

AI项目与工具 2025年06月12日 38 点赞 0 评论 636 浏览

CoGenAV

CoGenAV是一种先进的多模态学习模型，专注于音频和视觉信号的对齐与融合。通过对比特征对齐和生成文本预测的双重目标进行训练，利用同步音频、视频和文本数据，学习捕捉时间对应关系和语义信息。CoGenAV具备音频视觉语音识别、视觉语音识别、噪声环境下的语音处理、语音重建与增强、主动说话人检测等功能，适用于智能助手、视频内容分析、工业应用和医疗健康等多个场景。

AI项目与工具 2025年06月11日 80 点赞 0 评论 635 浏览

Ello

Ello是一款面向4-8岁儿童的AI阅读辅助工具，结合自适应学习系统和语音识别技术，提供个性化的阅读体验。它包含基于科学阅读法的解码电子书、AI实时辅导、互动阅读功能及激励机制，帮助孩子提升阅读能力、增强自信心。适用于家庭、学校及特殊教育场景，支持月度或年度订阅模式。

AI项目与工具 2025年06月12日 24 点赞 0 评论 631 浏览

语音识别

首页

语音识别

列表

默认

浏览次数

发布日期