MAVEN-Arg: 全方位事件理解数据集的事件论证注释

Nov, 2023

MAVEN-Arg: 全方位事件理解数据集的事件论证注释

MAVEN-Arg: Completing the Puzzle of All-in-One Event Understanding Dataset with Event Argument Annotation

Xiaozhi Wang, Hao Peng, Yong Guan, Kaisheng Zeng, Jianhui Chen...

TL;DRMAVEN-Arg 是一个全方位支持事件理解的数据集，它覆盖了事件检测、事件参数提取和事件关系提取，并提供了全面的架构、大规模数据和详尽的标注，对于细调的事件参数提取模型和大型语言模型均具有挑战，同时还展示了潜在应用之一，即未来事件预测。

Abstract

Understanding events in texts is a core objective of natural language understanding, which requires detecting event occurrences, extracting event arguments, and analyzing inter-event relationships. However, due to the annotation challenges brought by task complexity, a large-scale dataset covering the full process of →

event understanding event argument extraction event relation extraction maven-arg all-in-one dataset

发现论文，激发创造

事件论元抽取的资源增强神经模型

该研究提出了利用语法引导 transformer 的长距离依存关系，来提高事件面向序列编码的实体识别性能。在 ACE2005 数据集上，该方法取得了新的最高性能。

Oct, 2020

推动 100 多种事件类型的事件参数提取的泛化极限

该研究介绍了一个新的数据集 GENEVA，涵盖了 115 个事件和 187 个参数角色，用于评估不同方面的模型泛化能力，并比较不同模型的相对普适性，最后提出了 SCAD 新模型，其性能优于以前的模型，并为这些测试套件提供强大的基准。

May, 2022

MAVEN-ERE: 一个用于事件指代消解、时间、因果和子事件关系抽取的统一大规模数据集

本研究构建了一个统一的大规模人工标注事件关系提取数据集 MAVEN-ERE，并改进了标注方案。该数据集包含 103,193 个事件共指链，1,216,217 个时间关系，57,992 个因果关系和 15,841 个子事件关系，是现有所有事件关系提取任务数据集的十倍以上。实验表明，MAVEN-ERE 上的事件关系提取具有相当高的挑战性，联合学习可以提高性能。

Nov, 2022

MAVEN：一个大规模通用领域事件检测数据集

本研究提出了一种包含 4480 份维基百科文件、118732 次事件提及实例和 168 种事件类型的 MAVEN 数据集，用于缓解数据不足和低覆盖率等问题，实证分析了通用领域事件检测中的进一步研究方向，并表明现有的事件检测方法不能像小规模数据集中表现出的那样在 MAVEN 上表现出色，说明其在现实世界中仍然是具有挑战性的任务，需要进一步的研究和努力。

Apr, 2020

条件生成实现的文档级事件论元抽取

本文提出了一种文档级神经事件关系抽取模型，将其作为一种条件生成的过程，并使用事件模板。此外，作者构建了一个新的包含完整事件和共指注释的文档级事件抽取数据集 WikiEvents。研究结果表明，该模型在事件论证抽取方面取得了较好的性能，并展示了零样本事件提取框架的可移植性。

Apr, 2021

Few-Shot Document-Level Event Argument Extraction

本文研究如何在文档级别抽取跨句子传播的事件参数，提出了 FewDocAE 基准，介绍了在 Few-Shot 学习环境下采用先进的神经模型进行实验的基线结果。由于学习过程限制在非常少的例子上，这是一项具有挑战性的任务。希望该基准能够鼓励更多相关方面的研究。

Sep, 2022

基于文本推理的事件论元提取：多源学习实现零 - 和少样本

本文通过使用预训练推理模型，将事件论元抽取等 NLP 任务转化为文本蕴涵任务，证明了文本蕴涵模型在复杂任务中同样有效，且可以大幅减少人工标注量和依赖于特定领域语料库的限制。使用多份蕴涵数据集来预训练模型是获得优异结果的关键。

May, 2022

重新审视事件论元提取：当 EAE 模型意识到事件共现时，是否能学得更好？

本文主要介绍了通过利用事件共现特性可以提高事件提取以及事件参数提取质量，提出了一种基于表格生成的非自回归框架 TabEAE，并在 4 个数据集上进行了 3 种不同的训练推理方案实验，结果表明该方法在 4 个数据集上均达到了最优的性能表现。

Jun, 2023

EA$^2$E: 基于事件感知的文档级论点抽取一致性改进

本研究针对现有文档级事件参与者角色提取模型无法在跨事件生成具有一致性的结果的问题，提出了基于事件关系的一致性约束机制，并介绍了一种集成上下文信息的事件感知 Argument Extraction 模型（EA^2E）来提升模型的一致性，WIKIEVENTS 和 ACE2005 数据集上的实验结果显示 EA^2E 模型比基准模型表现更加出色。

May, 2022

超越单事件提取：迈向高效的文档级多事件论证提取

提出了一种多事件论证提取模型 DEEIA (Dependency-guided Encoding and Event-specific Information Aggregation)，该模型能够同时从文档中提取所有事件的论证，并能够在四个公共数据集上达到最新的最佳性能，并显著节省推理时间。

May, 2024