Reverb ASR Reverb ASR是一款基于深度学习的开源自动语音识别与说话人分离工具,采用20万小时高质量英语语音数据训练,具备高精度语音转录能力,支持逐字稿控制及多种解码模式。其显著特点是擅长处理长时间语音内容,并在长篇幅识别任务中超越其他开源模型。Reverb ASR适用于播客、会议记录、法庭记录等多个应用场景,为用户提供灵活且高效的语音转文字解决方案。 AI项目与工具 2025年06月12日 55 点赞 0 评论 542 浏览
FineVoice FineVoice是一种人工智能数字语音解决方案,可以帮助用户增强声音,并实时改变声音。它配有实时变声器,无限的音频和声音效果,录音室质量的录音机,文本到语音,语音到文本。 创作工具 1970年01月01日 0 点赞 0 评论 542 浏览
Voice Voice-Pro是一款开源的多功能音频处理工具,集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等功能,支持超过100种语言,广泛应用于教育、娱乐和商业领域,显著提升音频处理效率和便捷性。 AI项目与工具 2025年06月12日 33 点赞 0 评论 540 浏览
EasyVideoTrans EasyVideoTrans是一款开源的AI视频翻译工具,支持从视频中提取音频并翻译字幕,同时提供多样化的声音风格以实现自然的配音效果。它适用于视频创作者、教育机构、企业培训及品牌宣传等领域,能够快速生成高质量的中文版本视频,满足跨语言沟通的需求。 AI项目与工具 2025年06月12日 39 点赞 0 评论 540 浏览
MiniCPM MiniCPM-o 2.6 是一款高性能的多模态大模型,具备 8B 参数量,支持视觉、语音及多模态直播等多种功能。其在图像处理、语音识别和实时交互方面表现优异,采用高效的 token 技术提升推理速度,可在端侧设备上运行。支持多种语言和音色配置,适用于智能助手、内容创作、教育、客服和医疗等多个领域。 AI项目与工具 2025年06月12日 58 点赞 0 评论 540 浏览
Chirp 3 Chirp 3 是谷歌云推出的高清语音合成工具,支持 31 种语言和 248 种声音,能生成自然流畅的语音。具备多语言支持、自定义语音、流式合成等功能,适用于智能助手、有声读物、视频配音等场景。支持多种音频格式,注重数据安全与合规性。 AI项目与工具 2025年06月12日 16 点赞 0 评论 540 浏览
Subtitle Edit Subtitle Edit 是一款免费开源的多功能字幕编辑器,支持超过300种字幕格式。它具备字幕同步、创建、翻译、音频波形可视化、视频播放、AI语音识别、AI自动翻译和OCR技术等功能,适用于影视后期、多语言内容创作、教育培训及辅助听力障碍者等场景。其界面友好,操作简便。 AI项目与工具 2025年06月12日 61 点赞 0 评论 539 浏览
ChatPaper.ai 一个论文、视频、笔记的AI总结学习助手,轻松提炼论文精华、整理课堂重点、生成会议纪要。基于先进AI技术,支持多语言处理,为学生、研究者和职场人士量身打造。 Ai语音工具 2025年06月05日 44 点赞 0 评论 539 浏览