Nov, 2022

MT4SSL: 整合多个目标进行自监督语音表征学习的提升

TL;DR本文从获取自我训练目标的角度提供了一个新的自监督语音模型视角,并将目标提取器概括为离线目标提取器(Off-TE)和在线目标提取器(On-TE),在此基础上,提出了一个新的多任务学习框架 MT4SSL(即将多个目标整合以提高自监督语音表示学习),该模型在 LibriSpeech 基准测试中优于以前的 SSL 方法,并且在不需要超过数据的情况下,可与最佳表现模型相媲美甚至更好,在预训练阶段中使用 Off-TE 和 On-TE 可导致更好的收敛,因此我们认为从我们的角度在自监督语音模型上进行多任务学习是一个有前途的趋势。