Jun, 2024

错误跨度标注:人工评估机器翻译的平衡方法

TL;DR机器翻译评估中,综合的错误分类方法如多维度质量度量 (MQM) 需要耗费大量时间和专家参与,而只赋予整体评分,如直接评估 (DA),虽然简单快捷但可靠性较低。本文提出一种人工评估协议 —— 错误跨度标注 (ESA),将 DA 的连续评分与 MQM 的高级错误严重程度标记相结合。通过与 12 个 MT 系统和一份人工参考翻译 (英语到德语) 从 WMT23 的 MQM 和 DA 进行比较,验证了 ESA 的有效性。结果显示 ESA 在具有相同质量水平的情况下比 MQM 更快且更便宜,无需昂贵的 MQM 专家。