May, 2024

去噪语言模型:将错误修正模型推向语音识别极限

TL;DR使用大量合成数据进行训练的缩放误差校正模型 (Denoising LM) 在自动语音识别 (ASR) 系统中实现了最先进的性能表现,通过合成语音进入 ASR 系统并与原始文本配对训练,DLM 取得了 1.5% 的单词错误率 (WER) 以及在 Librispeech 上新的 ASR 性能记录,并展示了取代传统语言模型的潜力。