Feb, 2022

使用迁移学习和语言模型解码改进非母语英语的自动语音识别

TL;DR在语音识别系统中,使用 native English 训练出的模型在非母语人士的语音识别上表现欠佳。因此,本文对 pre-trained wav2vec 2.0 模型进行多种 L1 和 L2 训练条件的 fine-turning,并引入语言模型解码技术。这两种方法的量化收益及误差分析为改进模型的不同来源提供了数据,并证明了 L2 语音中引入语言模型解码技术的实用性。