EMNLPOct, 2023

以基于基础语言模型的零 - shot 忠诚度评估文本摘要

TL;DR提出一种新指标 FFLM,结合基于概率变化的方法评估生成模型的忠实度,相比于强基准模型 ChatGPT 拥有更少的参数,并在不一致性检测和忠实度评分方面表现出竞争性和优越性的改进。