EMNLPOct, 2023
段落级幻觉检测的新基准与反向验证方法
A New Benchmark and Reverse Validation Method for Passage-level Hallucination Detection
Shiping Yang, Renliang Sun, Xiaojun Wan
TL;DR本研究提出了一种基于反向验证的自检方法,以零资源方式自动检测事实错误,并构建了一个基于 ChatGPT 生成的、由人工注释的幻觉检测基准,在段落级别进行研究和评估不同方法,揭示了零资源方法的共同局限。