Dec, 2023

无注释自动音乐转录:基于可扩展合成数据和对抗领域混淆技术

TL;DR提出了一种无需注释数据的音乐自动转录模型,通过利用可扩展的合成音频进行预训练和对抗性域混淆,实现了比使用混合注释真实音频数据学习时更高的准确性,在 AMT 研究领域中,揭示了这种方法的可扩展性和面临的挑战。