May, 2024
大规模语言模型生成中的幻觉检测:基于词元概率的方法
Detecting Hallucinations in Large Language Model Generation: A Token Probability Approach
Ernesto Quevedo, Jorge Yero, Rachel Koerner, Pablo Rivas, Tomas Cerny
TL;DR使用两个简单的分类器和从其他 LLM 评估器获得的四个数值特征,本文引入了一种监督学习方法,取得了有希望的结果,并在三个不同基准测试中超越了当前最先进的成果。