开放信息抽取调查

COLINGJun, 2018

A Survey on Open Information Extraction

Christina Niklaus, Matthias Cetto, André Freitas, Siegfried Handschuh

TL;DR本文详细介绍了针对开放式信息抽取任务提出的各种方法，包括面临的挑战、方法的发展历程和解决的特定问题，同时评论了常用的评估程序以及展望未来的研究方向。

Abstract

We provide a detailed overview of the various approaches that were proposed to date to solve the task of open information extraction. We present the major →

open information extraction approaches challenges evaluation procedures future work

发现论文，激发创造

2007 年至 2022 年的开放式信息抽取 -- 综述

本文系统综述了 2007 年至 2022 年间的开放信息提取技术，提出了基于信息来源的新分类方法，并总结了三种主要方法、当前流行的数据集和模型评估指标，展示了数据集、信息来源、输出形式、方法和评估指标等方面的未来发展方向。

Aug, 2022

神经开放信息抽取综述：当前状态与未来方向

这篇文章针对开放信息抽取 (OpenIE) 进行了广泛的综述，其中包括最先进的神经网络 OpenIE 模型、它们的设计决策及其优缺点，以及当前解决方案的局限性和 OpenIE 问题本身存在的问题。最后，我们列出了能够扩展其范围和适用性的最新趋势，为 OpenIE 领域的未来研究开辟了有前途的方向。

May, 2022

开放信息提取

本文概述了两代 Open IE 系统，包括其优点、弱点和应用范围。第二代系统在深度语言学分析下，通过动词短语或从句提取最常见的关系类型，并获得比第一代系统更高的性能。

Jul, 2016

WiRe57：一个开放信息提取的细粒度基准测试

我们建立了一个公开信息提取的参考标准，解决了多个问题并生产了注释指南与评价脚本。在对七个系统进行比较后，我们发现 MinIE 表现最佳。

Sep, 2018

使用开放信息提取回答复杂问题

本研究提出了一种 Open IE 推理方法，利用最近提出的支持图优化框架进行 QA，从而使得可以更有效地处理所提出的方法中所述的多种难度级别的复杂问题。同时本方法不依赖于手动策划的知识。

Apr, 2017

科学文本中的开放信息抽取：一个评估

该论文使用众包方法评估两种最先进的开放信息抽取系统在 10 个不同学科的科学文本上的性能，发现 OIE 系统在科学文本上的表现明显劣于百科全书文本，在提供错误分析并建议减少错误的领域的同时，提出了一个句子和判断的语料库。

Feb, 2018

何时使用何种方法：一个深入比较的开放信息抽取系统的经验分析以支持下游应用

本文通过实证调查神经 OpenIE 模型、训练集和基准，旨在为用户选择最适合其应用的 OpenIE 系统提供帮助。我们发现，不同模型和数据集所做的不同假设对性能有显着影响，这使得选择最适合自己应用的模型至关重要。我们在下游复杂 QA 应用程序中演示了我们建议的适用性。

Nov, 2022

神经开放信息提取

本文提出了一种基于神经网络的 Open IE 方法，采用了编码器解码器框架和引导式自我学习的方法，实验表明这种方法比传统方法更优秀。

May, 2018

基于预训练语言模型的高效开放信息抽取数据学习

通过将 OpenIE 任务形式巧妙地转换为 T5 模型的预训练任务形式，并引入锚点的创新概念，OK-IE 显著减少了对大量训练数据的需求，消除了模型收敛速度慢的问题，实验结果显示，相较于之前的 SOTA 方法，OK-IE 仅需 1/100 的训练数据量（900 个实例）和 1/120 的训练时间（3 分钟）即可达到可比较的结果。

Oct, 2023

文档级信息提取概览

这篇综述研究对最近的文档级信息抽取文献进行了系统回顾，通过与当前最先进的算法进行彻底的错误分析，确定它们的局限性以及文档级信息抽取任务的剩余挑战，包括标签误差、实体关联解析和缺乏推理，严重影响文档级信息抽取的性能。本综述的目标是为 NLP 研究人员提供更多见解，帮助进一步提高文档级信息抽取的性能。

Sep, 2023