Apr, 2023

多语言词错误率评估:e-WER3

TL;DR提出了一种新颖的多语言语音识别框架 ——eWER3,通过联合训练声学和词汇表示来估计词错误率,该模型推动了邻近语言的表现,并在估计单词错误率的方法上优于以往的单语言方法(eWER2)。