- 以图为链条将复杂事件提取为图在科学领域中
我们提出了 EXCEEDS,一种新颖的端到端科学事件提取框架,在科学领域构建了一个多事件文档级数据集 SciEvents,并通过将密集的资源存储在一个网格矩阵中,并将复杂的事件提取简化为一个点构建和连接任务,实验证明 EXCEEDS 在 S - 辩论作为优化:适应性合规预测和多样化检索用于事件抽取
我们提出了一个多智能体辩论作为优化的事件提取系统,通过辩论而无需参数调整来迭代改进大型语言模型的输出。在该系统中,我们引入了两个新模块:Diverse-RAG 模块和 Adaptive Conformal Prediction 模块。实验结 - 基于大型语言模型的 5W1H 提取
通过 ChatGPT,我们基于高质量的 5W1H 数据集,设计了多种从零热点 / 少热点提示到高效调优的策略,以从原始新闻文档中提取 5W1H 分面。实验结果表明,调优后的模型在我们标记的数据集上的性能优于 ChatGPT。此外,我们还探讨 - ACL在基于问答的事件提取中迈向更好的问题生成
通过利用强化学习方法,我们提出了四个评估问题质量的标准,并在基于问题回答的事件提取中生成了流畅、具有概括性和上下文相关性的问题,从而为 QA 模型提供了明确的指导。在 ACE 和 RAMS 数据集上进行的广泛实验证实了我们方法的有效性,同时 - 从物联网数据到业务流程:挑战与框架
该研究提出了一个框架,通过一系列结构化步骤将低级 IoT 传感器数据转换为适用于过程挖掘的高级过程事件,以引导事件提取、抽象和关联,为特定分析技术和算法插入变化点。
- COLINGCMNEE:基于开源中国军事新闻的大规模文档级事件抽取数据集
提取军事文本中的结构化事件知识,包括事件触发器和相应的参数,对于许多应用非常重要,如情报分析和决策辅助。本研究提出了 CMNEE,一个大规模的、以文件级别为单位的开源中国军事新闻事件提取数据集,包含 17,000 个文档和 29,223 个 - COLING巴斯克语中的事件提取:基于语言类型学的跨语言迁移学习分析
跨语言转移学习对事件抽取研究中,源语言和目标语言的类型学相似度是否影响转移性能进行了探讨,并发现源语言与目标语言之间的共享语言特征对转移质量产生影响。该研究还介绍了一种 Basque 的事件抽取数据集 EusIE,供公众使用。
- EFSA: 事件级金融情感分析
该研究将金融情感分析(FSA)扩展到事件级别,通过设计粗细分类的事件类别,将事件从金融文本中提取出来,并提出了一个涵盖(公司,行业,粗事件,细事件,情感)的事件级别金融情感分析(EFSA)任务,在一个大规模的中文数据集上得到了与现有方法相媲 - 基于提示的图模型用于联合自由事件抽取和事件模式归纳
事件抽取任务旨在识别和分类事件,并根据事件模式找到其参与者。我们提出了一种基于提示的图模型用于自由事件抽取,该模型使用基于提示的方法获取候选触发器和参数,并构建异构事件图来编码事件内部和事件间的结构。实验结果表明,我们的方法在预定义事件模式 - EventRL: 利用结果监督增强大型语言模型的事件提取
本研究提出了 EventRL,一种强化学习方法,用于改进大型语言模型(LLMs)的事件提取。通过特定的奖励函数和结果监督,EventRL 有效解决了 LLMs 中的指令遵循和虚构等问题,改进了事件识别和结构化的性能,特别是在处理新事件类型方 - SEBERTNets: 面向金融领域的事件实体提取任务的序列增强 BERT 网络
提出了一种新型模型 SEBERTNets,能够准确提取事件实体和有效识别相应的事件实体,同时捕获序列语义信息;此外,还提出了一种混合序列增强 BERT 模型 HSEBERTNets,采用多通道召回方法来识别所有相应的事件实体。实验结果表明, - 事件提取的再评估:过去、现在和未来的挑战
本文讨论和解决事件提取评估中的挑战,并提出了 TextEE 作为一个标准化、公平和可重现的事件提取基准,包含了多个领域的标准化数据预处理脚本和数据集切分,重新评估了多个事件提取方法,并探索了大型语言模型在事件提取中的能力和未来挑战。
- EMNLPDemoSG: 低资源事件提取的展示增强模式引导生成
用于低资源环境下的事件抽取的演示增强的基于模式引导的生成 (DemoSG) 模型在利用演示说明的学习范式和基于模式提示的自然语言生成任务中,显著超越了当前低资源情景下的方法。
- ACL事件提取作为问题生成和回答
本文提出了 QGA-EE 模型,利用动态模板和问题生成技术有效处理事件提取任务中的多个参数、上下文信息和固定模板的问题,优于之前的单一任务模型,并在 ACE05 英语数据集上取得了最好的表现结果。
- CollabKG:一种可学习的人机协作信息提取工具套件,用于 (事件) 知识图谱构建
CollabKG 是一种可学习的人机协同信息提取工具包,可用于构建或扩展以实体为中心和事件为中心的知识图谱,并结合先进的提示式信息提取技术,实现人机协同机制,提高了注释质量、效率和稳定性。
- ACL细节决定成败:事件抽取评价的陷阱
本论文旨在检查事件提取(EE)评估的可靠性,并确定三个主要问题:数据预处理差异,输出空间差异和缺乏管道评估。通过综合元分析和实证实验,我们展示了这些问题的显著影响,并提出了一系列解决方案,包括指定数据预处理、标准化输出,提供管道评估结果。为 - 结构语义匹配实现联合事件抽取
本研究提出了一种基于深度学习的 NLP 模型,利用语义类型嵌入和动态结构编码器模块进行事件抽取和论证角色提取,用于信息抽取的关键任务之一的事件提取,并在 ACE2005 数据集上取得了显著的性能提升。
- 通过 Hard Expectation-Maximization 迭代改进生物医学实体链接和事件提取
本文提出了一种基于隐含变量的硬 EM 方法,联合进行生物医学实体链接和事件抽取,并通过 Genia 2011 和 BC4GO 两个基准数据集的实验结果展示了该方法在两个任务上均优于强基线模型。
- STAR: 利用大语言模型生成结构化文本数据增强低资源事件抽取
使用大型语言模型,提出 STAR 数据生成方法用于改善低资源事件抽取表现,数据生成比人工标注更有效。
- BAND:生物医学警报新闻数据集
介绍了一个包含 1508 个样本的医学警报新闻数据集,其中有 30 个流行病学相关问题,提供了几个基准任务,包括命名实体识别(NER)、问题回答(QA)和事件提取(EE),是流行病学家和 NLP 研究人员的重要资源。