EMNLPOct, 2022

面向文本生成的统一多维度评估器

TL;DR提出了一种基于多维度布尔问题回答任务的统一评价器 UniEval,通过指导模型回答不同问题的方式,从多维度评估自然语言生成的质量,并且通过中间学习阶段,UniEval 可以整合来自多个相关任务的外部知识,以实现更全面的评估。实验表明,UniEval 比现有的评估指标与人类判断的相关性更高,可在多个任务中实现强的零次学习能力。