Feb, 2024

乐谱变换器:端到端的光学乐谱识别超越单声部转录

TL;DR本研究提出了Sheet Music Transformer模型,这是首个能够在处理复杂音乐乐谱时不仅依赖于单音技术的端到端光学乐谱识别模型。模型基于Transformer的图像到序列框架,能够从输入图像中预测出标准的数字音乐编码格式的乐谱转录。实验结果表明,该模型不仅表现出了高度的能力,而且也优于目前最先进的方法,从而为端到端光学乐谱识别的进步做出了贡献。