quality estimation (QE) is an important component in making machine translation (MT) useful in real-world applications, as it is aimed to inform the user on the quality of the MT output at test time. Existing app
本文提出了一种简单的无监督翻译质量评估方法XLMRScore,该方法基于使用XLM-RoBERTa模型计算的BertScore,并讨论了使用此方法时出现的问题。接着,我们提出两种方法来缓解问题,并将所提出的方法用于四个WMT21 QE shared task中的低资源语言对以及本文介绍的一个新的英语-波斯语测试数据集。实验表明,在两个零-shot场景下,我们的方法可以获得与有监督基线相当的结果,即Pearson相关性差异小于0.01,在所有低资源语言对中的表现均优于无监督对手,平均超过8%。