Apr, 2022

使用遮蔽自编码器建模的遮蔽光谱图用于学习通用音频表示

TL;DR本文提出了一种新的通过自编码集成原始音频数据的方法:Masked Spectrogram Modeling(MSM),并使用 Masked Autoencoders(MAE)进行自监督学习,这种方法在 HEAR 2021 NeurIPS Challenge 中取得了比传统方法更好的结果。