Dec, 2023
RAGTruth: 开发可信赖的检索增强语言模型的幻觉语料库
RAGTruth: A Hallucination Corpus for Developing Trustworthy
Retrieval-Augmented Language Models
TL;DR本文介绍了用于分析不同领域和任务中基于检索增强生成(RAG)大型语言模型(LLMs)中词级幻觉的RAGTruth,这是一个用于测量幻觉程度的基准数据集,并评估了多种现有的幻觉检测方法,在幻觉检测方面,通过使用高质量的数据集如RAGTruth,可以对相对较小的LLM进行微调,并实现与使用GPT-4等最先进的大型语言模型的基于提示的方法相媲美的性能水平。