ACLJun, 2015

deltaBLEU: 一种针对本质多样化目标的生成任务的鉴别指标

TL;DR我们引入了判别式 BLEU (deltaBLEU),这是一种新的度量生成文本内在质量的度量方法;它能够在多样化的输出任务中为多参考文本 BLEU 加权,对于生成对话回复的任务,该度量方法与人类判断有较高相关性且在 Spearman's rho 和 Kendall's tau 方面优于句子级别和 IBM BLEU。