Dec, 2023

RAGTruth: 开发可信赖的检索增强语言模型的幻觉语料库

TL;DR本文介绍了用于分析不同领域和任务中基于检索增强生成(RAG)大型语言模型(LLMs)中词级幻觉的 RAGTruth,这是一个用于测量幻觉程度的基准数据集,并评估了多种现有的幻觉检测方法,在幻觉检测方面,通过使用高质量的数据集如 RAGTruth,可以对相对较小的 LLM 进行微调,并实现与使用 GPT-4 等最先进的大型语言模型的基于提示的方法相媲美的性能水平。