May, 2024
去噪语言模型:将错误修正模型推向语音识别极限
Denoising LM: Pushing the Limits of Error Correction Models for Speech
Recognition
TL;DR使用大量合成数据进行训练的缩放误差校正模型(Denoising LM)在自动语音识别(ASR)系统中实现了最先进的性能表现,通过合成语音进入ASR系统并与原始文本配对训练,DLM取得了1.5%的单词错误率(WER)以及在Librispeech上新的ASR性能记录,并展示了取代传统语言模型的潜力。