一种多格式迁移学习模型,用于事件论元提取,基于变分信息瓶颈
该研究提出了利用语法引导 transformer 的长距离依存关系,来提高事件面向序列编码的实体识别性能。在 ACE2005 数据集上,该方法取得了新的最高性能。
Oct, 2020
本文提出了一种基于图变换网络(GTNs)利用句子的句法和语义结构来学习更有效的句子结构的新模型,并引入了基于信息瓶颈的新归纳偏差来提高 EAE 模型的泛化性能,实验结果表明该模型在标准数据集上具有最先进的 EAE 性能。
Oct, 2020
本文提出了一种双向迭代 prompt-tuning 方法用于事件论元提取,将该任务视为填空式任务以充分利用实体信息和预训练语言模型(PLMs),通过引入上下文实体的论据角色来探索事件论证交互,并利用角色标签语义知识构建语义化言化器并为 EAE 任务设计三种模板,在 ACE 2005 英文数据集上进行有效性实验。
Oct, 2022
该研究提出了一种 Seq2Seq-like 的神经网络结构,用于解决事件参数抽取中存在的训练信号和顺序语义不足的问题,该结构使用具有上下文信息的实体 - 角色预测来生成参数角色。
Jul, 2021
该研究介绍了一个新的数据集 GENEVA,涵盖了 115 个事件和 187 个参数角色,用于评估不同方面的模型泛化能力,并比较不同模型的相对普适性,最后提出了 SCAD 新模型,其性能优于以前的模型,并为这些测试套件提供强大的基准。
May, 2022
本文研究如何在文档级别抽取跨句子传播的事件参数,提出了 FewDocAE 基准,介绍了在 Few-Shot 学习环境下采用先进的神经模型进行实验的基线结果。由于学习过程限制在非常少的例子上,这是一项具有挑战性的任务。希望该基准能够鼓励更多相关方面的研究。
Sep, 2022
本文介绍利用多语言预训练生成式语言模型进行零 - shot 的跨语言事件论元提取的研究。通过将 EAE 视为语言生成任务,论文提出的方法能够有效编码事件结构并捕获论元之间的依赖关系,提出了语言无关的模板以表示事件论元结构,从而适用于任何语言,最终在源语言训练模型,并直接应用于目标语言以实现事件论元提取。实验表明,所提出的模型在零 - shot 跨语言 EAE 方面优于当前最先进的模型,论文对它的优势和现有限制进行了全面的研究和误差分析。
Mar, 2022
本文主要介绍了通过利用事件共现特性可以提高事件提取以及事件参数提取质量,提出了一种基于表格生成的非自回归框架 TabEAE,并在 4 个数据集上进行了 3 种不同的训练推理方案实验,结果表明该方法在 4 个数据集上均达到了最优的性能表现。
Jun, 2023
基于文档的事件论证提取(EAE)需要从单个文档中提取多个事件的论证。我们提出了一个简单到复杂的渐进框架,通过计算每个事件的难度,并按照简单到复杂的顺序进行提取,以提供更可靠的记忆。在 WikiEvents 上的实验证明了我们的模型在 F1 上比 SOTA 高出 1.4%,这表明所提出的简单到复杂的框架对于 EAE 任务是有用的。
Oct, 2023
本文通过使用预训练推理模型,将事件论元抽取等 NLP 任务转化为文本蕴涵任务,证明了文本蕴涵模型在复杂任务中同样有效,且可以大幅减少人工标注量和依赖于特定领域语料库的限制。使用多份蕴涵数据集来预训练模型是获得优异结果的关键。
May, 2022