EMNLPMay, 2022

近似负样本区分:给人工评价数据集注入新生命

TL;DR本文提出了一种名为 Near-Negative Distinction(NND)的新颖和简单的自动评估方法,通过重新利用之前人类注释来建立 NLG 模型的偏好,我们发现 NND 在三个 NLG 任务(问题生成,问题回答和摘要)中取得了比标准 NLG 评估指标更高的与人工判断的相关性,这表明 NND 可以给人类注释提供第二次生命并提供低成本的 NLG 评估。