Feb, 2022

使用序列到序列模型进行自动语音识别的误差校正

TL;DR该研究使用预训练序列到序列模型BART,并对其进行自适应训练来对自动语音识别中的发音和拼写错误进行纠正,并采用词级对齐的简单方法重新评分。实验结果表明,该策略在口音语音数据上有效地矫正了大量ASR错误,并在与基准系统的比较中产生了改进的WER结果。然而,在印地语语法错误纠正任务中,该模型捕捉更广泛上下文的能力受到限制。