Sep, 2021

FastCorrect 2:自动语音识别中的多候选快速纠错

TL;DR本文提出了 FastCorrect 2,一种错误校正模型,并采用多候选项作为输入,以提高纠错精度。 FastCorrect 2 采用非自回归生成来进行快速推理,其中包括一个编码器,用于处理多个源语句,并且根据每个源标记的预测持续时间生成调整后的源语句;同时,提出了一种新的对齐算法和候选预测器,以最大程度地实现多个句子在令牌和发音相似性方面的令牌对齐,并检测适合解码器的最合适的候选项。实验结果表明,FastCorrect 2 可以减少单个候选者的 WER,比联级重评分和校正流水线更有效,并可用作 ASR 的统一后处理模块。