Sep, 2022

使用 BERTScore 评估 ASR 模型在失语言上的质量

TL;DR该研究调查了使用 BERTScore 作为语音识别模型质量评估的度量标准。BERTScore 与 WER 相比,在计算错误类型和评估方面更符合人工评定的标准。因此,BERTScore 可以在实际应用中辅助 WER,特别是在无障碍应用中,即使模型的精度比典型语音的精度低,模型仍然是有用的。