Dec, 2023
无注释自动音乐转录:基于可扩展合成数据和对抗领域混淆技术
Annotation-Free Automatic Music Transcription with Scalable Synthetic Data and Adversarial Domain Confusion
Gakusei Sato, Taketo Akama
TL;DR提出了一种无需注释数据的音乐自动转录模型,通过利用可扩展的合成音频进行预训练和对抗性域混淆,实现了比使用混合注释真实音频数据学习时更高的准确性,在 AMT 研究领域中,揭示了这种方法的可扩展性和面临的挑战。