定义幻觉的陷阱

Jan, 2024

The Pitfalls of Defining Hallucination

Kees van Deemter

TL;DR尽管自然语言生成（NLG）和大语言模型（LLMs）取得了令人印象深刻的进展，但研究人员对NLG评估的重要方面仍不清楚。为了证实这一观点，我检查了数据文本NLG中关于幻觉和省略的当前分类，并提出了基于逻辑的这些分类的综合。最后，我强调了关于幻觉的所有当前思考的一些残留限制，并讨论了对LLMs的影响。

Abstract

Despite impressive advances in natural language generation (NLG) and Large Language Models (LLMs), researchers are still unclear about important aspects of nlg evaluation. To substantiate this claim, I examine cu