Oct, 2022

DEMETR:用于翻译评估度量的诊断工具

TL;DR本研究旨在探讨机器翻译评估指标的行为特征,通过DEMETR诊断性数据集、跨越语义、语法和形态学错误类别的35种不同语言扰动,发现学习评价指标表现比基于字符串的指标表现更好,而且它们对不同现象的敏感度不同,该研究公开了DEMETR以推动机器翻译评估指标的更多发展。