May, 2023

MERT:音乐声学理解模型及大规模自监督训练

TL;DR利用自监督学习方法,结合教师模型的音乐理解模型能够在大规模数据上,通过留声机和 Constant-Q Transform 等多种教师模型的指导,将 BERT-style transformer encoder 更好地应用于音乐领域,提升了音乐检索等 14 项任务的表现。