Feb, 2023

PATCorrect:非自回归音素增强Transformer用于ASR误差校正

TL;DR本文提出了一种基于Transformer模型和音素编码器的新型非自回归(NAR)纠错方法,该方法通过减少单词错误率(WER)来提高转录质量,并在不同的上游ASR系统中实现了鲁棒性能,特别是在GPU硬件上实现了与其他NAR模型相当的推断延迟,并且比自回归模型快4.2-6.7倍。