NotaGen 是由中央音乐学院、北京航空航天大学和清华大学等机构联合开发的一款音乐生成模型。该模型借鉴了大型语言模型(LLM)的训练方法,专注于生成高质量的古典乐谱。其技术路线融合了预训练、微调与强化学习,其中预训练阶段使用了超过160万首乐曲数据,微调阶段则基于约9000首高质量古典作品进行优化,支持通过“时期-作曲家-乐器”等条件提示生成特定风格的音乐。在强化学习阶段,采用 CLaMP-DPO 方法,结合对比学习模型 CLaMP² 提供反馈,以提升音乐性和可控性,无需依赖人工标注或预定义奖励机制。实验表明,NotaGen 生成的音乐在主观测试中表现优异,接近人类创作水平。 NotaGen 提供多种模型规模选择,如 NotaGen-small、NotaGen-medium 和 NotaGen-large,适用于不同硬件环境和应用场景。其核心技术包括符号音乐表示(如 ABC 符号)、层次化 Transformer 解码器结构以及多模态反馈机制,能够生成结构严谨、旋律优美的音乐作品。 NotaGen 可用于音乐创作辅助、教学、影视配乐、表演排练及互动娱乐等多个领域,为用户提供高效且富有艺术性的音乐生成解决方案。
发表评论 取消回复