National Gallery Mixtape 是伦敦国家美术馆与 Google Arts & Culture 合作推出的 AI 音乐实验工具。用户可从 200 幅精选名画中选择最多 6 幅,AI 会分析画作的色彩、主题、情感和历史背景,生成匹配的音乐片段。用户可调整音量、顺序和叠加方式,并通过风格、乐器和心情标签定制音乐氛围。该工具基于谷歌 Gemini 模型,提供实时互动体验,适用于教育、艺
Parakeet TDT 0.6B 是一款由英伟达开发的开源自动语音识别(ASR)模型,采用 FastConformer 和 TDT 架构,具备高速转录、高精度识别、歌词转录、文本格式化等功能。模型在 Hugging Face Open ASR Leaderboard 中表现优异,实时因子高达 3386,适用于会议记录、法律医疗、字幕生成及音乐索引等多种场景。