Jul, 2023

音乐中语音自我监督学习的有效性研究

TL;DR通过使用两个音频方案 data2vec1.0 和 Hubert,我们训练了 $12$ 个自监督学习模型,并在 13 个不同的音乐信息检索任务中进行系统评估。我们的研究表明,使用音乐数据进行训练可以提高 MIR 任务性能,即使使用的是设计用于语音的模型,也能取得效果。但是,我们还发现现有的语音定向设计存在一些局限性,特别是在多声部信息建模方面。因此,我们为未来的音乐自监督学习策略和范式提供了实证建议。