Aug, 2022

自动语音识别端到端神经模型的鲁棒性分析

TL;DR本文研究了预训练神经模型在自动语音识别中的鲁棒性,并对 wav2vec2,HuBERT 和 DistilHuBERT 进行了鲁棒性分析,发现它们在 LibriSpeech 和 TIMIT 数据集上对噪声的鲁棒性不同,同时进行了层次分析以预测每层的学习,通过误差传播和对比清晰和嘈杂的数据,验证了 Pasad 等人的预测,并提出未来研究的有趣方向。