Apr, 2025

面向长上下文幻觉检测的研究

TL;DR本研究解决了大语言模型(LLMs)在长上下文输入中生成未经证实或与上下文矛盾的信息的问题。通过构建专门用于长上下文幻觉检测的数据集,并提出了一种新架构,使预训练的编码器模型能够有效地处理长上下文并检测幻觉,实验结果显示,该架构在各项指标上显著优于之前的模型,同时提供了更快的推理速度。