神经开放信息提取

May, 2018

Neural Open Information Extraction

Lei Cui, Furu Wei, Ming Zhou

TL;DR本文提出了一种基于神经网络的 Open IE 方法，采用了编码器解码器框架和引导式自我学习的方法，实验表明这种方法比传统方法更优秀。

Abstract

Conventional open information extraction (Open IE) systems are usually built on hand-crafted patterns from other NLP tools such as syntactic parsing, yet they face problems of error propagation. In this paper, we propose a neural Open IE approach with an →

open information extraction neural approach encoder-decoder framework bootstrapping empirical study

发现论文，激发创造

神经开放信息抽取综述：当前状态与未来方向

这篇文章针对开放信息抽取 (OpenIE) 进行了广泛的综述，其中包括最先进的神经网络 OpenIE 模型、它们的设计决策及其优缺点，以及当前解决方案的局限性和 OpenIE 问题本身存在的问题。最后，我们列出了能够扩展其范围和适用性的最新趋势，为 OpenIE 领域的未来研究开辟了有前途的方向。

May, 2022

开放信息提取

本文概述了两代 Open IE 系统，包括其优点、弱点和应用范围。第二代系统在深度语言学分析下，通过动词短语或从句提取最常见的关系类型，并获得比第一代系统更高的性能。

Jul, 2016

基于预训练语言模型的高效开放信息抽取数据学习

通过将 OpenIE 任务形式巧妙地转换为 T5 模型的预训练任务形式，并引入锚点的创新概念，OK-IE 显著减少了对大量训练数据的需求，消除了模型收敛速度慢的问题，实验结果显示，相较于之前的 SOTA 方法，OK-IE 仅需 1/100 的训练数据量（900 个实例）和 1/120 的训练时间（3 分钟）即可达到可比较的结果。

Oct, 2023

问题 - 答案对的开放式信息提取

NeurON 是一个从问题 - 答案数据对中提取元组的系统，它使用多源序列到序列学习任务将问题和答案的分布式表示组合在一起以生成知识事实，并比其他最先进的 OpenIE 方法找到更多新的有趣事实来扩展知识库。

Mar, 2019

开放信息抽取的语法多视角学习

本研究使用多视图学习将从开放域语句中提取的关系元组所需的句法信息从成分结构和依赖关系树映射到词级别的图中并进行拓展，达到更好地融合此类信息的目的。实验证明，这种多视图学习的方法与使用多种信息源构建元组是非常有效的。

Dec, 2022

使用开放信息提取回答复杂问题

本研究提出了一种 Open IE 推理方法，利用最近提出的支持图优化框架进行 QA，从而使得可以更有效地处理所提出的方法中所述的多种难度级别的复杂问题。同时本方法不依赖于手动策划的知识。

Apr, 2017

半开放的科技文本中关系提取初探

本研究针对科技文本的开放式关系抽取技术不足问题，将窄 IE 系统和开放式 IE 系统结合，提出了一种新的任务 —— 半开放式关系抽取，并应用于生物领域。研究在 FOBIE 数据集上，训练出能够提取生物学文本中重要关系和论述的最先进的窄 IE 系统，并在 10k 篇生物学开放式科技文本上运行窄 IE 系统和开放式 IE 系统，取得了过滤出 65% 的错误和无用开放式 IE 提取结果，并且发现保留下来的提取结果对于读者更有信息价值。

May, 2020

何时使用何种方法：一个深入比较的开放信息抽取系统的经验分析以支持下游应用

本文通过实证调查神经 OpenIE 模型、训练集和基准，旨在为用户选择最适合其应用的 OpenIE 系统提供帮助。我们发现，不同模型和数据集所做的不同假设对性能有显着影响，这使得选择最适合自己应用的模型至关重要。我们在下游复杂 QA 应用程序中演示了我们建议的适用性。

Nov, 2022

DetIE: 基于物体检测启发的多语言开放信息抽取

本文提出了一种基于计算机视觉中的物体检测算法启发的一种新型单遍 OpenIE 方法，并使用基于二分图匹配的无序损失和基于 Transformer 的编码器体系结构进行序列标记。该方法更快速并在标准基准测试中表现出优异的性能。我们还在两种语言的零 - shot 设置中对其进行了多语言版本的评估，并在多语言 Re-OIE2016 上展示了性能提高 15％，使两种语言的 F1 值均达到 75％以上。

Jun, 2022

通过迭代排名感知学习提高开放式信息提取

该研究提出一种方法，通过增加二进制分类损失和迭代学习过程来校准开放信息提取系统的置信度，并在 OIE2016 上的实验证明了该方法的有效性。

May, 2019