Mar, 2025

HalluVerse25:针对大语言模型幻觉的细粒度多语言基准数据集

TL;DR本研究解决了当前多语言环境下对于大语言模型(LLM)生成的非事实内容(即幻觉)缺乏细粒度标注数据集的问题。我们提出了HalluVerse25数据集,使用LLM生成幻觉并通过人类注释确保数据质量,显著提升了对多语言幻觉的检测能力。研究结果为不同上下文中大语言模型的幻觉检测提供了重要见解。