ACLJun, 2023

细节决定成败:事件抽取评价的陷阱

TL;DR本论文旨在检查事件提取(EE)评估的可靠性,并确定三个主要问题:数据预处理差异,输出空间差异和缺乏管道评估。通过综合元分析和实证实验,我们展示了这些问题的显著影响,并提出了一系列解决方案,包括指定数据预处理、标准化输出,提供管道评估结果。为了帮助实施这些解决方案,本论文还开发了一个一致的评估框架 OMNIEVENT。