语音识别
VideoTrans
一个开源的视频翻译和配音工具,VideoTrans能够一键识别视频字幕、翻译成其他语言以及进行多种语音合成,最终输出带字幕和配音的目标语言的视频。
Faster Whisper
Faster Whisper 是一款基于 OpenAI Whisper 模型的高效语音识别工具,利用 CTranslate2 引擎显著提升转写速度并降低内存消耗。它支持多语言处理,可应用于实时语音转写、视频字幕生成、客户服务、医疗记录等领域。其核心技术包括 8 位量化、语音活动检测(VAD)及模型优化,同时提供灵活的 API 接口供开发者集成。
卡卡字幕助手 | VideoCaptioner
一款基于 LLM 的智能字幕助手,无需GPU一键高质量字幕视频合成!支持生成、断句、优化、翻译全流程。卡卡字幕助手让视频字幕制作简单高效!优化、翻译,字幕视频全流程一键处理!
