EMNLPOct, 2018

BLEU 不适合于文本简化的评估

TL;DR本文表明,BLEU 评估指标并不适合评估句子分裂等结构方面的文本简化操作,并展示了 BLEU 评分与语法性和保留意义参数之间的低或无关性,并且,BLEU 评分通常与简洁性呈负相关,实质上惩罚了简单的句子。