Mar, 2023
SelfCheckGPT: 面向生成式大型语言模型的零资源黑盒幻觉检测
SelfCheckGPT: Zero-Resource Black-Box Hallucination Detection for Generative Large Language Models
Potsawee Manakul, Adian Liusie, Mark J. F. Gales
TL;DR本文提出了一种称为 SelfCheckGPT 的新方法,用于检测生成式大型语言模型中的错误事实,并在不需要外部数据库的情况下使用。该方法基于样本抽样,利用相似的句子包含一致事实的简单概念来判断事实的准确性。我们使用 GPT-3 生成 WikiBio 数据集中的个人传记来验证该方法,证明 SelfCheckGPT 可以检测非事实和事实句子,并按事实性对生成段落进行排序。