- MAILEX: 电子邮件事件和参数提取
本文首次提出了一个用于从电子邮件交流线程中提取事件的数据集(dataset),以及一种包含 10 种事件类型和 76 个参数的电子邮件领域新分类系统。作者在此基础上,进行了如下实验并得出结论:电子邮件中的事件提取这一任务尚未被很好地解决。在 - 通过概率偏置重新连接事件场域进行事件提取
本文提出了一种基于 PLMs 的 EE 框架,通过建模句法相关的事件字段作为概率偏差,并探索相同触发器 / 参数多次出现的概率交互策略,以增强事件提取性能。在实验中证明了该方法的有效性和有效性。
- ACL历史报纸广告的多语言事件抽取
这篇研究探讨如何从历史文本中提取事件,并介绍了一个在英语、法语和荷兰语中报导解放奴隶的早期殖民时期报纸广告所组成的新的多语言数据集,作者发现通过将问题描述为提取式 QA 任务,并利用现有的现代语言数据集和模型,即使数据有限,也能实现令人惊讶 - ACL大规模多语言事件理解:提取、可视化和搜索
本文介绍了一种跨语言事件抽取系统及其用户界面。仅使用英文训练数据,该系统可以处理 100 种语言的用户提供文本,并提供多种视图和搜索功能,支持结构化和自然语言查询。
- ACL使用去噪结构 - 文本增强提升事件抽取
本文提出了一种通过知识基础结构生成模型和深度强化学习代理程序迭代地从中选择有效子集的去噪结构生成增强框架(DAEE),以解决事件提取任务中语法不正确、结构不对齐和语义偏差等问题,并在多个数据集上进行试验,结果表明该方法生成了更多元化的事件提 - 可适应架构的知识图谱构建
提出了一种自适应架构的知识图谱构建方法,可以在动态变化的架构图中提取实体、关系、事件,并通过基准测试和实验结果证明其有效性。
- ACL对话生活事件抽取数据集 LED
本文介绍 Life Event Dialog 数据集,并提出了基于对话数据的新型对话生活事件提取任务,对前沿的三种信息抽取方法(OpenIE、关系抽取和事件抽取)的表现进行了综合实证分析,说明目前的事件抽取模型仍然难以从人类日常对话中提取生 - COFFEE: 一种对比的无神谕框架用于事件抽取
提出一种名为 COFFEE 的新框架,其使用对比选择模型来矫正产生的触发器、处理多事件实例,从而仅基于文档上下文提取事件,解决了不包含事件类型、事件本体以及触发词等 Oracle 信息的 Oracle-Free Event Extracti - 通过连续提示的抽取式问答从 Twitter 中提取 COVID-19 事件
社交媒体分析可用于评估 COVID-19 演变和捕捉有助于卫生机构处理疫情的消费者讨论,并将事件提取问题视为利用语言模型中的连续提示进行抽取式问答,显著提高 COVID-19 事件插槽的 F1 分数。
- 探索 ChatGPT 在事件提取中的可行性
本文研究了用 ChatGPT 进行事件抽取的可行性并探究了遇到的挑战,结果表明 ChatGPT 在长尾和复杂情况下只有任务特定模型 EEQA 的 51.04%的性能,ChatGPT 不够稳定,继续改进提示不会导致稳定的性能提高,而且 Cha - 基于贝叶斯翻译模型的事件时间关系提取
本研究通过使用 Bayesian-Trans 的贝叶斯学习方法,建立了一个以潜在变量为中心的模型来对事件之间的时间关系进行建模,具有更强的对预测不确定性的编码和表达的能力,并且在事件之间的时间关系抽取上表现出更好的性能。
- ACL带提示的全局约束的零样本事件论元分类
本文使用全局约束和提示来有效地处理事件参数分类,而无需任何标注和特定任务的训练,使用新的提示模板,可以轻松适应所有事件和参数类型,并且在多个数据集上实验证明了该方法的有效性。
- 面向政策制定的自然语言处理
自然语言处理作为一种计算机工具,可对政治活动中的文本进行解析,包括文本分类、主题建模、事件提取和文本标度等方法,并且这些方法可以用于数据收集、政策解释、政策沟通和政策影响调查等四大应用领域。但同时也需要注意潜在的局限性和伦理问题。
- EMNLPMask-then-Fill: 一种用于事件抽取的灵活有效的数据增强框架
本文提出了一个名为 Mask-then-Fill 的灵活有效的数据增强框架,可以在保持原有事件结构不变的前提下更灵活地操作文本以生成更加多样化的数据。该方法可以用更多种类的文本替换原有文本,相比现有的方法,它可以替换任意长度的一段文本而非仅 - 基于指针网络编码器 - 解码器架构的事件结构提取
通过提出基于指针网络的编码器 - 解码器模型,构建一种与众不同的元组格式以表示事件记录和相应角色信息,实现事件信息的提取和表示的端到端解决方案,实验表明此方法在 ACE2005 数据集上取得了具有竞争力的效果。
- EMNLPMEE:一份新颖的多语言事件提取数据集
提出了一种新的跨语言的事件抽取数据集,称为 MEE,其中注释了 8 种具有不同语言类型的语言中的 50000 多个实体提及、事件触发和事件参数。在此数据集上进行的实验发现多语言事件抽取的挑战和机遇。
- EMNLP利用上下文定义对齐的零样本事件抽取
该论文提出了一种零样本事件抽取方法,通过使用两个转换器模型将事件提及及其定义投射到相同的嵌入空间,通过对比学习来最小化它们的嵌入距离以实现定义语义建模,并在 MAVEN 数据集上进行了实验,表现优于之前的零样本和有样本监督方法。
- EMNLP面向事件抽取的开放词汇论点角色预测
本文旨在设计一种无监督框架 RolePred,通过预训练语言模型自动生成事件类型下的参数角色,从而优化事件抽取过程。此外,作者基于维基百科数据集构建了一个包含 142 个自定义参数角色语义信息的新的事件抽取数据集,并最终在该数据集上验证了 - EMNLP用大规模中文标题数据集基准测试开放式事件提取
本文提供了一个大规模句子级别数据集,对开放式事件抽取进行基准测试,其中包含来自中国网页的 34000 多个新闻标题,为当前事件抽取问题上的高级研究提供了重要的依据。
- EMNLPEventGraph:事件提取作为语义图解析
本文介绍了 EventGraph,一种将事件编码为图形的联合框架,通过将触发事件和参数表示为语义图形中的节点,以此来解决事件提取的问题,并表明该模型在 ACE2005 上达到了和最先进的系统一样的结果,并且在参数提取方面有了显著的改善。