Jun, 2024

LLM 幻觉检测的概率框架:基于信念树传播

TL;DR本文提出了一种基于概率的框架 Belief Tree Propagation(BTProp)用于 LLM 产生语句的幻觉检测,通过引入逻辑相关语句的置信树与隐藏马尔可夫树模型,以系统性的方式整合 LLM 在这些语句中的置信分数,实验结果表明我们的方法在多个幻觉检测基准测试中相对于基线提升了 3% - 9%(通过 AUROC 和 AUC-PR 评估)。