Jul, 2024

幻觉检测:在大型语言模型中可靠地区分可信答案

TL;DR通过使用名为RelD的鲁棒性判别器,本文提出了一种有效检测大型语言模型中幻觉问题的方法,并在构建的RelQA双语问答对话数据集上进行了训练。实验结果表明,该方法成功检测到了由不同大型语言模型生成的幻觉回答,且能够区分内部和外部分布数据集中的幻觉问题。此研究为可靠答案的检测做出了重要贡献,并对未来幻觉问题的缓解具有显著的意义。