Feb, 2024

关于大规模自供训练方法在少样本语音分类中的可迁移性

TL;DR近年来,自监督学习因其能够从无标签数据中学习出鲁棒特征表示而取得了优异结果。本研究评估了大规模自监督模型在少样本音频分类中的性能,并探讨了模型的少样本学习能力与其他下游任务基准的关系,发现在某些少样本问题(如 SpeechCommandsv2)中具有最先进的性能,并且语音为基础的少样本问题与各种下游音频任务之间存在强相关性。