Oct, 2024

倡导多语言自动语音识别评估中的字符错误率

TL;DR本研究针对传统的单一英语数据集评估方法,指出了词错误率(WER)在多语言语音识别中的局限性,尤其在复杂形态词和缺乏明确词边界的语言中。我们主张采用字符错误率(CER)作为主要评估指标,证明了CER在多语言场景中具有更好的一致性和更接近人类评判的相关性,从而对评估标准提出了新的见解与影响。