Mar, 2023

无监督的跨语言语音识别误率标准化

TL;DR提出了一种基于拼写和分词的自动化 WER 规范系统,通过在四种语言上的实验,平均 WER 降低了 13.28%。同时,基于该系统的标注数据的人工实验结果表明,该文中所提出的 WER 规范方法与 ASR 输出的感知质量高度一致。