Jul, 2024

LLM内部状态揭示面对查询时的幻觉风险

TL;DR研究大型语言模型的幻觉问题如何通过自我感知估计幻觉风险,通过对神经元、激活层和令牌的研究,提出了一种探测器来实现语言模型的自我评估,试验结果表明其幻觉估计准确率达到84.32%。