ACLAug, 2021

语言模型增强相关性得分

TL;DR本文介绍了一种新的面向语言生成的评估标准,即 Language Model Augmented Relevance Score(MARS)。该标准引入了强化学习引导的预训练语言模型来创建上下文感知的评估参考,并将之用于对生成文本进行评分。与已有的七种评估标准相比,MARS 不仅更好地反映了人类评价,而且在较大程度上区分了良好生成结果和对抗样本。