Oct, 2021

基于Conformer的自监督学习用于非语音音频任务

TL;DR本文提出了一种自监督的音频表征学习方法并将其应用于多种非语音音频任务,这种自监督的预训练可以将标记数据需求减少三分之二,并在 AudioSet 基准测试中通过声音自主训练实现了 0.415 的平均平均精度(mAP)得分,在多个下游任务中,我们的 fine-tuned conformers 也超越或匹配以往以监督方式预训练的系统的性能。