Jun, 2024

从合成音频 Doppelgangers 进行对比学习

TL;DR通过使用合成音频生成具有因果关系的音色、音高和时间包络变化的混合音频,我们提出了一种轻量级的方法来学习健壮的音频表示,该方法可以减轻从真实世界音频中获取大规模数据的负担,并在标准音频分类基准上取得强大的表现。