Oct, 2022

DiffRoll:基于扩散的生成式音乐转录技术及无监督预训练能力

TL;DR提出了一种新的生成方法,DiffRoll,来处理自动音乐转录问题。它将 AMT 视为有条件的生成任务,从其理论上训练模型来从纯高斯噪声中生成逼真的钢琴卷,因此 DiffRoll 不需要分类器,可在仅提供钢琴卷的不配对数据集上训练。实验证明,DiffRoll 的性能优于其判别式对应物 19 个百分点,并且其消融研究还表明,其性能优于类似的现有方法 4.8 个百分点。