Feb, 2023

面向事实一致性的语音识别

TL;DR本文提出了一种优化框架来减少自动语音识别模型产生的幻听,该框架通过使用先前训练好的评估器计算现实一致性得分,最大限度地优化 ASR 模型,以最大限度地提高 ASR 假设与基础事实一致性的期望得分,实验结果表明,使用提出的框架训练的 ASR 模型产生了与交叉熵训练的 ASR 模型相当的单词错误率,同时生成的 ASR 假设与基准真实转录的一致性得分显著提高,而且通过大型语言模型生成的会话摘要的可靠性也得到了提升。