事件抽取的零样本迁移学习
该论文提出了一种零样本事件抽取方法,通过使用两个转换器模型将事件提及及其定义投射到相同的嵌入空间,通过对比学习来最小化它们的嵌入距离以实现定义语义建模,并在 MAVEN 数据集上进行了实验,表现优于之前的零样本和有样本监督方法。
Nov, 2022
本文提出了一种新的半监督事件类型归纳方法,使用掩蔽对比损失学习事件提及之间的相似性以及通过近似数据中的底层流形来解离已发现的群集,从而实现事件类型归纳和 FrameNet 帧的链接。
Feb, 2022
本文提出了一种无监督事件抽取流程,使用先进的预训练语言模型并匹配语义,有效将事件映射到预定义的事件类型上,最终表现出色,成功地将 83% 的触发器和 54% 的参数映射到了正确类型。
Dec, 2020
通过研究零样本事件检测中的事件类型和定义,提出了使用多样化的事件类型和定义来提高模型遵循事件定义的方法,并构建了一个自动生成的多样化事件定义(DivED)数据集进行实证研究,结果显示,大量的事件类型和多样化的事件定义可以显著提升事件提取性能,同时在训练中引入事件本体信息和困难负样本可以进一步提高性能,基于这些发现,在 DivED 数据集上微调 LLaMA-2-7B 模型,在三个零样本事件检测基准上取得了超越 GPT-3.5 等最新大语言模型的性能。
Mar, 2024
本文提出了一个阅读理解框架,用于解决文本数据中的事件抽取问题,并在少量数据上进行优化,取得了零样本以及少样本情况下的优异表现,其次还在 ACE 2005 基准数据集上取得了最佳性能。
Oct, 2020
本文提出了一种无监督的零样本实体类型的方法,该方法可以弹性地识别新定义的类型,并利用 FREEBASE 的布尔函数进行自我推理。我们在包括生物领域的各种数据集上评估了该系统,并证明了它在超出领域的数据集上优于监督学习方法与其他零样本细粒度关键词方法。
Jul, 2019
本文提出了使用远程监督自动生成训练数据,利用结构化知识库和神经网络模型来提高事件抽取的效果的方法。通过实验结果表明,该方法可以大量生成高质量的训练数据,并且可以识别出多种类型的事件。
Dec, 2017
我们提出了一种用于解决连续事件提取中语义混淆问题的新颖模型,通过为每个句子标记伪标签来缓解语义混淆,并在当前和之前的模型之间传递关键知识以提高对事件类型的理解,此外还通过利用其他关联类型来鼓励模型集中关注长尾事件类型的语义,实验结果表明我们的模型优于最先进的基线算法,并在不平衡数据集上表现出色。
Oct, 2023
本文提出了一种新的事件提取框架,该框架使用事件类型和参数角色作为自然语言查询,从输入文本中提取候选触发器和参数。通过查询中的丰富语义,我们的框架受益于注意机制,以更好地捕捉事件类型或参数角色与输入文本之间的语义相关性。此外,查询和提取公式允许我们的方法将来自各种本体的所有可用事件注释作为统一模型来利用。在 ACE 和 ERE 上的实验表明,本方法在每个数据集上均取得了最先进的性能,并在零 - shot 事件提取上显著优于现有方法。
Oct, 2021