Mar, 2023

SelfCheckGPT: 面向生成式大型语言模型的零资源黑盒幻觉检测

TL;DR本文提出了一种称为 SelfCheckGPT 的新方法,用于检测生成式大型语言模型中的错误事实,并在不需要外部数据库的情况下使用。该方法基于样本抽样,利用相似的句子包含一致事实的简单概念来判断事实的准确性。我们使用 GPT-3 生成 WikiBio 数据集中的个人传记来验证该方法,证明 SelfCheckGPT 可以检测非事实和事实句子,并按事实性对生成段落进行排序。