IJCAIMay, 2024

层次解码实现面向真实世界的多音钢琴音频转谱

TL;DR基于序列到序列模型的钢琴音频转谱任务中使用层次解码器,结合多任务学习实现对小节和音符级别音符信息的转录,同时通过预处理方法保留谱表结构以重构声部;通过两阶段训练方案,首先在合成音频上进行预训练,然后在人类演奏录音上进行微调从而弥补合成数据与人类演奏录音之间的差距。实验结果表明,该方法在合成音频数据与当前最先进技术相比的转录性能以及对人类演奏录音的首次实验方面具有良好效果。