EMNLPOct, 2023

段落级幻觉检测的新基准与反向验证方法

TL;DR本研究提出了一种基于反向验证的自检方法,以零资源方式自动检测事实错误,并构建了一个基于 ChatGPT 生成的、由人工注释的幻觉检测基准,在段落级别进行研究和评估不同方法,揭示了零资源方法的共同局限。