从文本文档中检测和提取事件
该研究旨在分析自然语言文本,利用语义注释挖掘文本语料库中的重要事件,解锁语料库中的知识宝库,并就如何识别重要事件、进行语义搜索和事件分析等问题进行了探讨。
Mar, 2016
本文提出了一种新的任务,中间级别的重要事件检测,旨在从新闻语料库中检测在特定时间 / 位置发生的关键事件,并聚焦于相同的主题。为了解决这些挑战,我们开发了一个无监督的重要事件检测框架 EvMine,它提取时间频繁的 peak 短语,通过从我们设计的 peak 短语图中检测社区将 peak 短语合并成事件相关的特征集,使用从事件相关特征集自动生成的伪标签训练分类器,并利用检索到的文档迭代检测到的关键事件。
Jun, 2022
本综述文章聚焦于从事件中心的角度提取新闻叙事,包括合成、组织、评估方法等方面,总结了 900 多篇相关文章中的 54 篇研究,分析了近年来的趋势和未来的挑战和潜在研究方向。
Feb, 2023
该研究旨在验证文本理解是否已经发展到可以通过注释手册衍生出精炼的陈述来提取事件信息的程度,通过引入一个采用这种陈述的模型示例,实验表明我们可以在封闭本体中提取事件,并通过阅读新的定义来概括未见过的事件类型。
Dec, 2019
本文提出了一个新的方法来建立事件、实体及它们关系变量之间的依赖关系,并在文档级别上执行联合推理,以使上下文的信息得到充分利用,实现上下文感知式的预测,并证明其大幅优于现有的事件提取和实体提取方法以及强基线。
Sep, 2016
这篇研究探讨如何从历史文本中提取事件,并介绍了一个在英语、法语和荷兰语中报导解放奴隶的早期殖民时期报纸广告所组成的新的多语言数据集,作者发现通过将问题描述为提取式 QA 任务,并利用现有的现代语言数据集和模型,即使数据有限,也能实现令人惊讶的好结果;对于历史语言的跨语言低资源学习也具有高度的挑战性,实际上,历史数据集的机器翻译到目标语言经常是最好的解决方案。
May, 2023
本研究基于用户评论、文本会话和电话会话等多种非正式、异构数据,提出了一个大规模的汉语事件检测数据集,并通过实验证明了非正式和异构数据的挑战性,为多源非正式事件检测提供了新的探索。
Nov, 2022
本文讨论和解决事件提取评估中的挑战,并提出了 TextEE 作为一个标准化、公平和可重现的事件提取基准,包含了多个领域的标准化数据预处理脚本和数据集切分,重新评估了多个事件提取方法,并探索了大型语言模型在事件提取中的能力和未来挑战。
Nov, 2023
本文提出了一个阅读理解框架,用于解决文本数据中的事件抽取问题,并在少量数据上进行优化,取得了零样本以及少样本情况下的优异表现,其次还在 ACE 2005 基准数据集上取得了最佳性能。
Oct, 2020