Apr, 2024

PoLLMgraph: 大型语言模型中透过状态转换动态解开幻觉

TL;DR我们提出了 PoLLMgraph,一种用于大型语言模型的多种同类白盒检测和预测方法,通过分析生成过程中 LLM 的内部状态转换动态来有效地检测虚构现象,实验证明其比现有方法在 TruthfulQA 等常见基准数据集上具有 20% 以上的 AUC-ROC 改进效果,为 LLM 的模型化白盒分析开辟了新的途径。