基于准确语料库的开放信息提取的跨度模型

AAAIJan, 2019

基于准确语料库的开放信息提取的跨度模型

Span Model for Open Information Extraction on Accurate Corpus

Junlang Zhan, Hai Zhao

TL;DR本文提出了一种新的 Open IE 算法，采用跨度模型替代传统序列标注法通过对训练数据和测试数据进行改进和优化，实现了在基准测试数据集中的最新最佳表现。

Abstract

open information extraction (Open IE) is a challenging task especially due to its brittle data basis. Most of Open IE systems have to be trained on automatically built corpus and evaluated on inaccurate test set.

open information extraction training dataset test set span model state-of-the-art performance

发现论文，激发创造

基于预训练语言模型的高效开放信息抽取数据学习

通过将 OpenIE 任务形式巧妙地转换为 T5 模型的预训练任务形式，并引入锚点的创新概念，OK-IE 显著减少了对大量训练数据的需求，消除了模型收敛速度慢的问题，实验结果显示，相较于之前的 SOTA 方法，OK-IE 仅需 1/100 的训练数据量（900 个实例）和 1/120 的训练时间（3 分钟）即可达到可比较的结果。

Oct, 2023

神经开放信息提取

本文提出了一种基于神经网络的 Open IE 方法，采用了编码器解码器框架和引导式自我学习的方法，实验表明这种方法比传统方法更优秀。

May, 2018

神经开放信息抽取综述：当前状态与未来方向

这篇文章针对开放信息抽取 (OpenIE) 进行了广泛的综述，其中包括最先进的神经网络 OpenIE 模型、它们的设计决策及其优缺点，以及当前解决方案的局限性和 OpenIE 问题本身存在的问题。最后，我们列出了能够扩展其范围和适用性的最新趋势，为 OpenIE 领域的未来研究开辟了有前途的方向。

May, 2022

DetIE: 基于物体检测启发的多语言开放信息抽取

本文提出了一种基于计算机视觉中的物体检测算法启发的一种新型单遍 OpenIE 方法，并使用基于二分图匹配的无序损失和基于 Transformer 的编码器体系结构进行序列标记。该方法更快速并在标准基准测试中表现出优异的性能。我们还在两种语言的零 - shot 设置中对其进行了多语言版本的评估，并在多语言 Re-OIE2016 上展示了性能提高 15％，使两种语言的 F1 值均达到 75％以上。

Jun, 2022

利用大型语言模型和一致的推理环境掌握开放信息提取任务

通过构建合适的推理环境，本文探索利用大型语言模型（LLMs）解决开放式信息抽取（OIE）问题，实验结果表明，相较于最先进的监督方法，我们的 6-shot 方法在标准 CaRB 基准上实现了 55.3 的 F1 分数，同时在 TACRED 和 ACE05 上实验结果显示，我们的方法可以自然地推广到其他信息抽取任务，并分别获得了 5.7 和 6.8 的 F1 分数提升。

Oct, 2023

开放信息提取

本文概述了两代 Open IE 系统，包括其优点、弱点和应用范围。第二代系统在深度语言学分析下，通过动词短语或从句提取最常见的关系类型，并获得比第一代系统更高的性能。

Jul, 2016

通过迭代排名感知学习提高开放式信息提取

该研究提出一种方法，通过增加二进制分类损失和迭代学习过程来校准开放信息提取系统的置信度，并在 OIE2016 上的实验证明了该方法的有效性。

May, 2019

分析开放信息抽取系统的误差

本文介绍了针对开放信息抽取系统的基准测试，并进行了四种常见 OIE 系统的性能比较和错误类别影响分析，并提出了下一代 OIE 系统的重要研究方向。

Jul, 2017

开放信息抽取的语法多视角学习

本研究使用多视图学习将从开放域语句中提取的关系元组所需的句法信息从成分结构和依赖关系树映射到词级别的图中并进行拓展，达到更好地融合此类信息的目的。实验证明，这种多视图学习的方法与使用多种信息源构建元组是非常有效的。

Dec, 2022

利用语言增强的嵌入技术进行开放信息抽取

自然语言处理中的开放信息提取（OIE）通过引入预训练语言模型和语言特征，通过 Seq2Seq 预训练语言模型提升 OIE 架构性能，并在性能评估中获得了 24.9%、27.3% 和 14.9% 的改进。此外，还介绍了其他挑战，如利用语义依赖解析标签减少计算开销、创建干净的合成数据集以及探究 OIE 行为在结构化预测模型中的表现。

Mar, 2024