MAVEN-Arg: 全方位事件理解数据集的事件论证注释
该研究提出了利用语法引导 transformer 的长距离依存关系,来提高事件面向序列编码的实体识别性能。在 ACE2005 数据集上,该方法取得了新的最高性能。
Oct, 2020
该研究介绍了一个新的数据集 GENEVA,涵盖了 115 个事件和 187 个参数角色,用于评估不同方面的模型泛化能力,并比较不同模型的相对普适性,最后提出了 SCAD 新模型,其性能优于以前的模型,并为这些测试套件提供强大的基准。
May, 2022
本研究构建了一个统一的大规模人工标注事件关系提取数据集 MAVEN-ERE,并改进了标注方案。该数据集包含 103,193 个事件共指链,1,216,217 个时间关系,57,992 个因果关系和 15,841 个子事件关系,是现有所有事件关系提取任务数据集的十倍以上。实验表明,MAVEN-ERE 上的事件关系提取具有相当高的挑战性,联合学习可以提高性能。
Nov, 2022
本研究提出了一种包含 4480 份维基百科文件、118732 次事件提及实例和 168 种事件类型的 MAVEN 数据集,用于缓解数据不足和低覆盖率等问题,实证分析了通用领域事件检测中的进一步研究方向,并表明现有的事件检测方法不能像小规模数据集中表现出的那样在 MAVEN 上表现出色,说明其在现实世界中仍然是具有挑战性的任务,需要进一步的研究和努力。
Apr, 2020
本文提出了一种文档级神经事件关系抽取模型,将其作为一种条件生成的过程,并使用事件模板。此外,作者构建了一个新的包含完整事件和共指注释的文档级事件抽取数据集 WikiEvents。研究结果表明,该模型在事件论证抽取方面取得了较好的性能,并展示了零样本事件提取框架的可移植性。
Apr, 2021
本文研究如何在文档级别抽取跨句子传播的事件参数,提出了 FewDocAE 基准,介绍了在 Few-Shot 学习环境下采用先进的神经模型进行实验的基线结果。由于学习过程限制在非常少的例子上,这是一项具有挑战性的任务。希望该基准能够鼓励更多相关方面的研究。
Sep, 2022
本文通过使用预训练推理模型,将事件论元抽取等 NLP 任务转化为文本蕴涵任务,证明了文本蕴涵模型在复杂任务中同样有效,且可以大幅减少人工标注量和依赖于特定领域语料库的限制。使用多份蕴涵数据集来预训练模型是获得优异结果的关键。
May, 2022
本文主要介绍了通过利用事件共现特性可以提高事件提取以及事件参数提取质量,提出了一种基于表格生成的非自回归框架 TabEAE,并在 4 个数据集上进行了 3 种不同的训练推理方案实验,结果表明该方法在 4 个数据集上均达到了最优的性能表现。
Jun, 2023
本研究针对现有文档级事件参与者角色提取模型无法在跨事件生成具有一致性的结果的问题,提出了基于事件关系的一致性约束机制,并介绍了一种集成上下文信息的事件感知 Argument Extraction 模型(EA^2E)来提升模型的一致性,WIKIEVENTS 和 ACE2005 数据集上的实验结果显示 EA^2E 模型比基准模型表现更加出色。
May, 2022
提出了一种多事件论证提取模型 DEEIA (Dependency-guided Encoding and Event-specific Information Aggregation),该模型能够同时从文档中提取所有事件的论证,并能够在四个公共数据集上达到最新的最佳性能,并显著节省推理时间。
May, 2024