Aero

简介：Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型，拥有 1.5 亿参数，专注于长音频处理，支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色，具备高效的训练方法和多任务处理能力，适用于语音助手、实时转写、归档理解等场景。

AI小编 568 阅读 0 评论 43 点赞

官网地址

Aero-1-Audio 是由 LMMs-Lab 研发的一款轻量级音频模型，基于 Qwen-2.5-1.5B 构建，参数量为 1.5 亿。该模型专为长音频处理设计，支持连续输入长达 15 分钟的音频内容，无需分段即可保持上下文连贯性。在语音识别（ASR）任务中表现优异，具备较高的准确率，并在复杂音频分析和指令驱动任务方面展现出较强的能力。 Aero-1-Audio 具备多项核心功能，包括长音频处理、高精度语音识别、多类型音频分析以及指令执行能力，适用于多种实际场景。其技术架构强调高效与轻量化，通过优化训练方法和计算资源利用，实现了在较小规模下达到高性能的效果。此外，模型支持多任务处理，在多个基准数据集上取得了良好的词错误率（WER）表现。项目已在 HuggingFace 模型库上线，方便开发者进行调用和研究。

本文分类：AI项目与工具
本文标签：AI音频模型语音识别长音频处理轻量级模型多任务处理音频分析 ASR 智能语音助手高效训练音频理解
浏览次数：568 次浏览
发布日期：2025-06-11 00:00:00
本文链接：https://tools.sihangdaima.com/AIxiangmuyugongju/7973.html

评论列表共有 0 条评论

暂无评论

Aero

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复