COLINGMar, 2024

检测争议话题中检索增强生成模型中的虚构和覆盖错误

TL;DR基于维基百科的中立观点原则,我们探索了一种应对 LLM 聊天机器人中有争议话题的策略:承认单一真实答案的缺失,并呈现多个观点。我们将其框架为检索增强生成,其中观点从知识库中检索出来,LLM 的任务是从给定的观点中生成流畅而忠实的回应。我们使用一种确定性的检索系统作为起点,然后关注在这种文本生成方法中出现的常见 LLM 故障模式,即幻觉和覆盖错误。我们提出并评估了三种基于(1)词重叠,(2)重要性和(3)基于 LLM 的分类器来检测这些错误的方法。我们的结果表明,即使只在合成错误上进行训练,基于 LLM 的分类器在错误检测性能上也能达到很高的水平,幻觉检测的 ROC AUC 得分为 95.3%,覆盖错误检测为 90.5%(对于明确的错误案例)。我们展示了当没有可用的训练数据时,我们的其他方法在幻觉检测(84.0%)和覆盖错误检测(85.2%)上仍然产生良好的结果。