- 事件提取:综述
本综述介绍了从文本中检测事件的方法,探讨了任务定义、评估方法、基准数据集和方法学的分类,并展望了事件检测的未来研究方向。
- COLINGOneEE:一种快速重叠和嵌套事件提取的一阶段框架
OneEE 是一种简单而有效的标注方案和模型,将事件提取作为词词关系识别来表述,它在同时识别触发词或参数词之间的关系方面表现出色,具有很快的事件提取速度,并在 FewFC、Genia11 和 Genia13 三个基准测试上取得了最先进的结果 - 基于中文电子病历的端到端临床事件提取
该研究利用端到端事件提取模型提取医疗文本中的四个维度属性,并在临床发现事件挖掘任务中获得了第二名,模型效果取得了较好的表现。
- DICE: 用生成模型实现高效数据临床事件抽取
通过引入 DICE,一种强大而高效的、面向临床文本的、用于事件抽取的生成模型,结合领域专家提供的描述来提高在低资源情况下的性能,该模型通过学习辅助提及标识任务来定位和绑定生物医学提及,并将其作为触发器和参数候选人引入相应的任务中,结果表明 - 利用开放语料库进行协同知识图谱融合
本文提出了一种协作知识图谱融合框架,旨在使用从其他语料库中收集到的信息来精细化已有的知识图谱,并改进联合事件抽取与知识图谱融合的性能。
- 通过自我训练与梯度指导提高事件抽取
提出了一种自训练与梯度引导(STGG)框架用于事件提取任务,可应用于任意基础事件提取模型以利用广泛的未标记数据进行性能改进。
- ACL基于模板的生成式事件抽取动态前缀调优
本文提出了一种生成式基于模板的事件抽取方法,通过将上下文信息与类型特定前缀相结合,学习每个上下文的上下文特定前缀。实验结果表明,该模型在 ACE 2005 上达到了与最先进的基于分类的 OneIE 相媲美的结果,在 ERE 上表现最好,并且 - 原油相关事件提取与处理:迁移学习方法
本文提出了一个完整的框架,通过转移学习的有效性,从 CrudeOilNews 语料库中提取和处理与原油相关的事件,解决了注释稀缺和类别不平衡的问题,除了事件提取,还着重于事件属性(极性、情态和强度)分类,以确定每个事件的事实确定性,这对于如 - CrudeOilNews: 带事件抽取的原油新闻注释语料库
本文介绍了 CrudeOilNews 的数据收集过程、标注方法学和事件类型学,旨在为经济和金融文本挖掘提供贡献性资源,通过种子数据扩充和人类协商来拓展数据集,在机器学习目的方面,训练了基本的事件提取模型。
- 通过句子简化改进零样本事件提取
本文提出一种通用方法,在 MRC 模型的指导下执行无监督的句子简化,以改善 MRC-based 事件提取的性能,并在 ICEWS 地缘政治事件提取数据集上进行评估,特别关注 'Actor' 和 'Target' 参数角色,结果显示上下文简化 - 通过对比损失增强的批量关注,半监督地识别并描述新事件类型
本文提出了一种新的半监督事件类型归纳方法,使用掩蔽对比损失学习事件提及之间的相似性以及通过近似数据中的底层流形来解离已发现的群集,从而实现事件类型归纳和 FrameNet 帧的链接。
- 从新闻文本中提取空间态势感知事件
本文探索了利用文本输入进行太空态势感知任务,并构建了一个涵盖所有已知活动卫星的 48.5k 新闻文章的语料库,通过基于依赖规则的提取系统来标识太空事件句子,并通过人工标注来提取事件插槽。研究表明,采用最先进的神经抽取系统在这个低资源、高影响 - 写作风格感知的文档级事件抽取
事件提取模型针对多领域文档的写作风格,提出了一个与上下文相关的监督机制来建模文档中的事件结构信息,结果表明该方法能够较好地捕捉这种写作风格的模式。
- ACL查询和提取:基于类型导向二进制解码的事件抽取优化
本文提出了一种新的事件提取框架,该框架使用事件类型和参数角色作为自然语言查询,从输入文本中提取候选触发器和参数。通过查询中的丰富语义,我们的框架受益于注意机制,以更好地捕捉事件类型或参数角色与输入文本之间的语义相关性。此外,查询和提取公式允 - EMNLP视频和文章的联合多媒体事件抽取
本篇论文介绍了一种新的视频多媒体事件提取(Video M2E2)任务以及两个创新组件,用于构建该任务的第一个系统。该方法能够从视频和文本文档中提取结构化事件信息,未来将会公开发布包括 860 对视频 - 文章对的新基准。实验结果证明了该方法 - EMNLP利用图卷积网络和上下文子树有效地进行商品新闻事件抽取
本文介绍了一种使用图卷积网络 (GCN) 和修剪的依赖关系解析树来更好地从商品新闻中提取事件的方法。该方法采用基于 ComBERT 的特征嵌入来训练事件提取模型,实验结果表明,该方法的效率比现有方法高,F1 得分达到 0.90。此外,我们的 - 跨语言事件抽取的语言模型预训练
本篇研究提出了一个新颖的、与语言无关的方法来对语言模型进行 “引导”,从而在低资源和零 - shot 跨语言环境中提供特别有效的性能。
- EMNLP基于语料库的开放领域事件类型归纳
本文提出了一种基于语料库的开放领域事件类型归纳方法,该方法使用聚类 <谓词意义,对象头> 对每种事件类型进行表示,并利用选择显著谓词和对象头、利用动词意义词典消歧谓词语义、联合嵌入和聚类 <谓词意义,对象头> 对事件类型进行潜在球面空间的建 - ACLDEGREE: 一种数据高效的基于生成的事件抽取模型
文章提出了一种数据有效性事件提取模型 DEGREE,通过联合学习触发器和参数,利用设计的提示语义指导模型,能够在少量有标注数据的情况下进行低资源端到端的事件提取,并从生成的自然语言摘要中提取最终事件预测结果。
- CasEE: 基于级联解码的重叠事件抽取联合学习框架
本研究提出了一种名为 CasEE 的联合学习框架,用于解决事件提取过程中存在的事件重叠问题,它可以有效地提取具有不同角色的多种类型的事件,同时在 FewFC 数据集上得到了显著的提升。