Oct, 2020

自学习和预训练对于语音识别互补

TL;DR这篇论文研究了自我训练和无监督预训练以提高语音识别系统的有效方法,并揭示了伪标记和使用 wav2vec 2.0 进行预训练在各种标签数据集上是有互补性的。使用 Libri-light 的仅 10 分钟标注数据和 LibriVox 的 53000 小时未标注数据,在 Librispeech 的测试集上实现了 3.0%/ 5.2%的识别率,这与一年前只经过 960 小时标注数据训练的最佳系统相媲美。使用所有标注数据的训练实现了 1.5%/ 3.1%的识别率。