ACLMar, 2021

BlonDe:一种用于文档级机器翻译的自动评估指标

TL;DR本文提出了一种新型的自动评估方法 BlonDe,通过将话语连贯性考虑在内来扩大自动翻译评估的范围,从句子级别提高到文档级别,该方法能够更好地区分文档级别的翻译质量改进和句子级别的改进,并且具有更好的判别性、可解释性和敏感性。在大规模的人类研究中,BlonDe 也成功地取得了比前期评估指标更高的 Pearson r 相关度。