从文本文档中检测和提取事件

MMJan, 2016

Detecting and Extracting Events from Text Documents

Jugal Kalita

TL;DR本文探讨了如何从文本中挖掘事件和附带信息，主要应用了机器学习技术进行事件检测和摘要，并讨论了在医学和 Twitter 上运用的应用和未来挑战

Abstract

events of various kinds are mentioned and discussed in text documents, whether they are books, news articles, blogs or microblog feeds. The paper starts by giving an overview of how events are treated in

events linguistics computational linguistics machine learning event detection

发现论文，激发创造

事件提取：综述

本综述介绍了从文本中检测事件的方法，探讨了任务定义、评估方法、基准数据集和方法学的分类，并展望了事件检测的未来研究方向。

Oct, 2022

事件搜索与分析：基于语义注释的语料库中事件的识别与搜索分析

该研究旨在分析自然语言文本，利用语义注释挖掘文本语料库中的重要事件，解锁语料库中的知识宝库，并就如何识别重要事件、进行语义搜索和事件分析等问题进行了探讨。

Mar, 2016

大规模文本语料中的无监督关键事件检测

本文提出了一种新的任务，中间级别的重要事件检测，旨在从新闻语料库中检测在特定时间 / 位置发生的关键事件，并聚焦于相同的主题。为了解决这些挑战，我们开发了一个无监督的重要事件检测框架 EvMine，它提取时间频繁的 peak 短语，通过从我们设计的 peak 短语图中检测社区将 peak 短语合并成事件相关的特征集，使用从事件相关特征集自动生成的伪标签训练分类器，并利用检索到的文档迭代检测到的关键事件。

Jun, 2022

基于事件的新闻叙事提取调查

本综述文章聚焦于从事件中心的角度提取新闻叙事，包括合成、组织、评估方法等方面，总结了 900 多篇相关文章中的 54 篇研究，分析了近年来的趋势和未来的挑战和潜在研究方向。

Feb, 2023

阅读说明书：事件提取即定义理解

该研究旨在验证文本理解是否已经发展到可以通过注释手册衍生出精炼的陈述来提取事件信息的程度，通过引入一个采用这种陈述的模型示例，实验表明我们可以在封闭本体中提取事件，并通过阅读新的定义来概括未见过的事件类型。

Dec, 2019

文档上下文中实体和事件的联合提取

本文提出了一个新的方法来建立事件、实体及它们关系变量之间的依赖关系，并在文档级别上执行联合推理，以使上下文的信息得到充分利用，实现上下文感知式的预测，并证明其大幅优于现有的事件提取和实体提取方法以及强基线。

Sep, 2016

历史报纸广告的多语言事件抽取

这篇研究探讨如何从历史文本中提取事件，并介绍了一个在英语、法语和荷兰语中报导解放奴隶的早期殖民时期报纸广告所组成的新的多语言数据集，作者发现通过将问题描述为提取式 QA 任务，并利用现有的现代语言数据集和模型，即使数据有限，也能实现令人惊讶的好结果；对于历史语言的跨语言低资源学习也具有高度的挑战性，实际上，历史数据集的机器翻译到目标语言经常是最好的解决方案。

May, 2023

MUSIED：多源异构非正式文本事件检测基准

本研究基于用户评论、文本会话和电话会话等多种非正式、异构数据，提出了一个大规模的汉语事件检测数据集，并通过实验证明了非正式和异构数据的挑战性，为多源非正式事件检测提供了新的探索。

Nov, 2022

事件提取的再评估：过去、现在和未来的挑战

本文讨论和解决事件提取评估中的挑战，并提出了 TextEE 作为一个标准化、公平和可重现的事件提取基准，包含了多个领域的标准化数据预处理脚本和数据集切分，重新评估了多个事件提取方法，并探索了大型语言模型在事件提取中的能力和未来挑战。

Nov, 2023

针对少样本事件抽取探测和微调阅读理解模型

本文提出了一个阅读理解框架，用于解决文本数据中的事件抽取问题，并在少量数据上进行优化，取得了零样本以及少样本情况下的优异表现，其次还在 ACE 2005 基准数据集上取得了最佳性能。

Oct, 2020