Jan, 2025

D3RM:一种用于钢琴转录的离散去噪扩散精炼模型

TL;DR 本研究针对现有自动音乐转录技术中的性能不足问题,提出了一种新颖的离散去噪扩散模型架构,专注于钢琴转录。通过引入邻域注意力层作为去噪模块以及独特的训练和推理状态转换策略,实验表明该模型在MAESTRO数据集上实现了超过以往扩散模型和基线模型的转录表现,显示出显著的提升潜力。