PengChengStarling

介绍：鹏城实验室开源的一款多语言语音识别系统开发工具包，PengChengStarling可以在统一的框架内处理多种语言语音输入，支持实时语音识别，边说边识别。

536 阅读 0 评论 66 点赞

前往官网

PengChengStarling是鹏城实验室开源的多语言语音识别系统，具备实时语音识别功能，可广泛应用于国际会议转录、视频字幕生成和跨语言客服等场景。

该系统基于icefall项目开发，模型体积仅为Whisper-Large v3的20%，但推理速度快7倍。支持中、英、俄、越南、日、泰、印尼和阿拉伯语等8种语言，统一框架处理多语言输入，显著提升识别效率。

主要特点：

应用场景：

性能测试显示，PengChengStarling在流式语音识别方面表现优异，每种语言约2000小时的开放数据集训练为其多语言能力奠定坚实基础。

系统还支持自适应技术，可根据用户语音特征优化识别准确率，特别适合嘈杂环境使用。

Github：https://github.com/yangb05/PengChengStarling

HuggingFace：https://huggingface.co/stdo/PengChengStarling

暂无评论