Nov, 2023

音频中无监督的音乐对象发现

TL;DR我们提出了一种新的方法,将 SlotAttention 结构应用于音频领域,实现了无监督的音乐分解。我们介绍了一个基于频谱图的多对象音乐数据集,用于评估西方调性音乐上的对象中心学习。MusicSlots 在无监督的音符发现上表现良好,并在监督音符属性预测任务上优于几种常用对比方法。