ACLNov, 2022

HaRiM$^+$:使用幻觉风险评估摘要质量

TL;DR本研究提出一个基于口令似然性的无参考度量,名为 HaRiM+,用于衡量生成摘要的虚假程度,可以用于衡量摘要质量,且在三个摘要质量注释数据集中均表现出最先进的与人工判断相关性,希望这项工作有助于推动自动摘要模型的发展。