事件提取:综述
本综述文章聚焦于从事件中心的角度提取新闻叙事,包括合成、组织、评估方法等方面,总结了 900 多篇相关文章中的 54 篇研究,分析了近年来的趋势和未来的挑战和潜在研究方向。
Feb, 2023
本文讨论和解决事件提取评估中的挑战,并提出了 TextEE 作为一个标准化、公平和可重现的事件提取基准,包含了多个领域的标准化数据预处理脚本和数据集切分,重新评估了多个事件提取方法,并探索了大型语言模型在事件提取中的能力和未来挑战。
Nov, 2023
本文介绍了 EventGraph,一种将事件编码为图形的联合框架,通过将触发事件和参数表示为语义图形中的节点,以此来解决事件提取的问题,并表明该模型在 ACE2005 上达到了和最先进的系统一样的结果,并且在参数提取方面有了显著的改善。
Oct, 2022
本文提出了一个阅读理解框架,用于解决文本数据中的事件抽取问题,并在少量数据上进行优化,取得了零样本以及少样本情况下的优异表现,其次还在 ACE 2005 基准数据集上取得了最佳性能。
Oct, 2020
该研究旨在验证文本理解是否已经发展到可以通过注释手册衍生出精炼的陈述来提取事件信息的程度,通过引入一个采用这种陈述的模型示例,实验表明我们可以在封闭本体中提取事件,并通过阅读新的定义来概括未见过的事件类型。
Dec, 2019
这篇研究探讨如何从历史文本中提取事件,并介绍了一个在英语、法语和荷兰语中报导解放奴隶的早期殖民时期报纸广告所组成的新的多语言数据集,作者发现通过将问题描述为提取式 QA 任务,并利用现有的现代语言数据集和模型,即使数据有限,也能实现令人惊讶的好结果;对于历史语言的跨语言低资源学习也具有高度的挑战性,实际上,历史数据集的机器翻译到目标语言经常是最好的解决方案。
May, 2023
该研究旨在分析自然语言文本,利用语义注释挖掘文本语料库中的重要事件,解锁语料库中的知识宝库,并就如何识别重要事件、进行语义搜索和事件分析等问题进行了探讨。
Mar, 2016
本文首次提出了一个用于从电子邮件交流线程中提取事件的数据集(dataset),以及一种包含 10 种事件类型和 76 个参数的电子邮件领域新分类系统。作者在此基础上,进行了如下实验并得出结论:电子邮件中的事件提取这一任务尚未被很好地解决。在接下来的研究中,还需要更多的深入探究。
May, 2023