Oct, 2023

xCOMET: 透明的机器翻译评估通过精细化错误检测

TL;DR本研究介绍了一种名为 xCOMET 的开源学习度量方法,它融合了语句级评估和错误跨度检测能力,并展现出在各种评估类型(语句级、系统级和错误跨度检测)方面的最先进性能,同时突出和分类错误跨度,从而丰富了质量评估。通过稳健性分析和压力测试,我们还表明 xCOMET 在识别局部关键错误和产生幻觉方面有很强的能力。