May, 2024

大规模语言模型生成中的幻觉检测:基于词元概率的方法

TL;DR使用两个简单的分类器和从其他 LLM 评估器获得的四个数值特征,本文引入了一种监督学习方法,取得了有希望的结果,并在三个不同基准测试中超越了当前最先进的成果。