Mar, 2024

事实揭示:用于幻觉检测的事实蕴含

TL;DR介绍了一种新颖的事实推理方法(Factual Entailment),用于检测大型语言模型生成的内容中的事实错误(hallucinations),并提出了一个基准数据集(FACTOID)用于评估和排名语言模型的自动错误产生脆弱性指数(Auto Hallucination Vulnerability Index) 。