Mar, 2024

LIEDER:语言信息引导的论述实体识别评估

TL;DR语篇实体识别任务中,大型语言模型在识别基本的语篇实体方面展现出一定的能力,但对于控制语篇实体引入和后续参照的基本语义特性了解程度的评估仍未充分。本文提出了 Linguistically-Informed Evaluation for Discourse Entity Recognition(LIEDER)数据集,详细检测了语言模型对于存在、唯一性、复数性和新颖性这四个关键语义特性的知识。研究结果显示,目前最先进的大型语言模型对于除新颖性以外的所有特性表现出敏感性,这说明它们在人类级别的语言理解能力上还有一定差距。