Jul, 2021
自动机器翻译评估指标的全面评估:是否需要进行交付
To Ship or Not to Ship: An Extensive Evaluation of Automatic Metrics for
Machine Translation
Tom Kocmi, Christian Federmann, Roman Grundkiewicz, Marcin Junczys-Dowmunt, Hitokazu Matsushita...
TL;DR该研究对机器翻译中评估标准的可靠性进行了探究,发现使用自动指标作为唯一评判标准可能导致错误决策,需要依赖人工判断作为参考,并发布了收集到的大规模人工翻译质量评价数据集,以供进一步研究。