Mar, 2022

基于语言模型整合的传声器语音识别的实证研究

TL;DR在端到端的 RNN-Transducer(RNN-T)中使用仅文本数据是具有挑战性的,本文研究了使用密度比和内部语言模型(ILM)估计的方法来将外部语言模型(ELM)集成到 RNN-T 中以实现语音识别,并提出了一种低阶密度比方法(LODR),在 LibriSpeech,Tedlium-2,WenetSpeech 和 AISHELL-1 数据集上的大量实验表明,LODR 始终优于 SF,在大多数测试中表现优于 DR 且一般性能接近 ILME。