ACLMay, 2020

SciREX: 用于文档级信息抽取的挑战数据集

TL;DR本文介绍 SciREX,它是一个涵盖多个 IE 任务的文档级 IE 数据集,包括通过科学文章识别突出实体和文档级的 $n$ 元关系识别。我们开发了一个神经模型作为一个强有力的基线,扩展了先前的 IE 模型到文档级 IE。分析模型性能显示,人类表现和当前基线之间存在显著差距,邀请社区使用我们的数据集作为发展文档级 IE 模型的挑战。