May, 2024

ANAH:大型语言模型中幻觉的分析注释

TL;DR减少大型语言模型的“幻觉”问题对其广泛应用非常关键。本论文提出了ANAH数据集,对生成式问答中语言模型的“幻觉”进行了精细的测量与注释,并通过实验验证了ANAH训练的生成式标注模型在细粒度幻觉注释方面的优势,表现超过目前的开源大型语言模型和GPT-3.5,与GPT-4的性能竞争,对于未知问题具有更好的泛化能力。