Nov, 2022

data2vec-aqc:在教师 - 学生培训环境中寻找合适的助教

TL;DR提出一种名为 data2vec-aqc 的自监督学习算法,利用数据增强,量化表示和聚类等技术来提高语音领域中有限的未标记和标记数据的质量。该算法在 LibriSpeech 的测试数据集上实现了 14.1%至 20.9%的相对词错误率改进,并且在 SwitchBoard 数据上微调时相对于基线 data2vec 获得了高达 17.8%的相对 WER 改进。