Jan, 2024

UCorrect:一种无监督的自动语音识别错误修正框架

TL;DR自动语音识别(ASR)误差校正中,提出了一种不依赖于训练数据的无监督检测 - 生成 - 选择框架 UCorrect,它能显著减少词语错误率(WER),无需微调可达 6.83%,微调后可达 14.29%,显著优于其他 NAR 修正模型,并具有竞争性的低延迟;同时,它是一种通用方法,可减少不同解码策略和不同规模数据集上训练的 ASR 模型的 WER。