Aug, 2023

TrOMR:基于 Transformer 的多声部光学乐谱识别

TL;DR该研究提出了一种基于 Transformer 的方法,名为 TrOMR,具有优秀的全局感知能力,用于端到端的复调 OMR。通过引入一种新颖的一致性损失函数和合理的数据注释方法来提高对复杂乐谱的识别精度,并在大量实验证明 TrOMR 在真实场景中优于当前 OMR 方法。同时,研究开发了一个 TrOMR 系统,并构建了一个用于真实世界中的全页乐谱的相机场景数据集。提供了代码和数据集以便于重现。