Sep, 2023

音色陷阱:一种用于不受乐器限制的音乐转录的低资源框架

TL;DRTimbre-Trap 是一个新型框架,通过利用音高和音色之间的强分离性,将音乐转录和音频重建相统一。我们通过训练一个 U-Net 模型,同时估计音高显著性和重建复杂谱系数,通过简单的切换机制在解码阶段选择其中之一的输出。我们证明了该框架的性能可与最先进的无特定乐器转录方法相媲美,而只需要少量的带注释数据。