May, 2023

评估可控长度机器翻译的功效

TL;DR本文通过对 18 个自动摘要或机器翻译的评估指标进行人工评估,发现 BLEURT 和 COMET 与人工评估相关性最高,最适合作为可控长度机器翻译的评价指标。