Sep, 2020

DWIE: 一个面向实体为中心的多任务文本级信息抽取数据集

TL;DR本文介绍了 DWIE,即 “德国之声信息提取语料库”,它是一个多任务数据集,结合了四个主要的信息提取子任务:命名实体识别,共指解析,关系抽取和实体链接。该数据集是以实体为中心的,描述了概念实体的交互和属性,并提出了一种新的基于实体的度量标准以及基于图神经网络的模型用于跨文档共享信息跨任务训练。实验表明,这个模型在 DWIE 数据集上取得了 5.5 个 F1 的提升,因此具有促进多任务信息提取中的图神经网络表示学习方面的研究潜力。