Jul, 2022

针对低资源语言的不匹配感知无监督翻译质量评估

TL;DR本文提出了一种简单的无监督翻译质量评估方法 XLMRScore,该方法基于使用 XLM-RoBERTa 模型计算的 BertScore,并讨论了使用此方法时出现的问题。接着,我们提出两种方法来缓解问题,并将所提出的方法用于四个 WMT21 QE shared task 中的低资源语言对以及本文介绍的一个新的英语 - 波斯语测试数据集。实验表明,在两个零 - shot 场景下,我们的方法可以获得与有监督基线相当的结果,即 Pearson 相关性差异小于 0.01,在所有低资源语言对中的表现均优于无监督对手,平均超过 8%。