May, 2020

提高噪声学生训练用于自动语音识别

TL;DR本文研究了在自动语音识别中使用自适应 SpecAugment 的噪声自适应训练方法,通过过滤、平衡和增强数据集,成功地提高了网络性能,使 WER 在 LibriSpeech 测试集上分别为 4.2%/8.6%(无噪声 / 有噪声),并在 LibriLight 上达到了 1.7%/3.4%(无噪声 / 有噪声)