May, 2023

EntRED: 基于少量快捷方式进行关系抽取的基准测试

TL;DR本研究发现,在现有的关系抽取标准基准数据集中,数据集中的实体注释存在大量错误的情况,实体命名多样性较低,并且易于从实体名字的快捷方式到基本事实关系。为此,我们提出了一个新的具有挑战性的关系抽取数据集 EntRED,提高了实体多样性,并通过引入基于因果推理(CI)的端到端实体替换管道 ERIC。我们将 ERIC 应用于 TACRED 以生成 EntRED。实验表明,即使针对强关系模型,其性能在 EntRED 上也会显着下降,该模型仅仅记忆实体名字的模式而不是从文本上下文推理。