Dec, 2023

基于大规模互补神经语言模型的格栅重新评分

TL;DR我们研究了使用大规模先进神经语言模型(NLMs)对自动语音识别(ASR)假设进行格栅再评分的效果。通过将最多 8 个 NLMs 进行组合,通过迭代式格栅生成,逐步改进给定格栅弧上的语言评分,我们逐渐降低 ASR 假设的错误。此外,我们还研究了在长篇演讲等持续语音的格栅序列中传递上下文信息(先前的再评分结果)的有效性。在使用演讲语料库进行实验时,通过组合这八个 NLMs 并使用上下文传递,我们相较于 ASR 一流基准线获得了 24.4% 的相对词错误率降低。另外,我们还进行了非迭代式的 NLM 组合和使用大规模 NLMs 的 100 最佳再评分的同时比较,验证了迭代式 NLM 组合进行格栅再评分的优势。