越南开放信息提取

Jan, 2018

Vietnamese Open Information Extraction

Diem Truong, Duc-Thuan Vo, U.T Nguyen

TL;DR本研究提出了一种基于从句分析方法的越南语开放信息提取系统，实验结果表明，该系统的精确度达到了 83.71％。

Abstract

open information extraction (OIE) is the process to extract relations and their arguments automatically from textual documents without the need to restrict the search to predefined relations. In recent years, several OIE systems for the English language have been created but there is n

open information extraction vietnamese language clause-based approach dependency parsing extractable relations

发现论文，激发创造

开放信息提取

本文概述了两代 Open IE 系统，包括其优点、弱点和应用范围。第二代系统在深度语言学分析下，通过动词短语或从句提取最常见的关系类型，并获得比第一代系统更高的性能。

Jul, 2016

科学文本中的开放信息抽取：一个评估

该论文使用众包方法评估两种最先进的开放信息抽取系统在 10 个不同学科的科学文本上的性能，发现 OIE 系统在科学文本上的表现明显劣于百科全书文本，在提供错误分析并建议减少错误的领域的同时，提出了一个句子和判断的语料库。

Feb, 2018

分析开放信息抽取系统的误差

本文介绍了针对开放信息抽取系统的基准测试，并进行了四种常见 OIE 系统的性能比较和错误类别影响分析，并提出了下一代 OIE 系统的重要研究方向。

Jul, 2017

OPIEC：一个开放的信息提取语料库

本文释放、描述和分析了一个名为 OPIEC 的 OIE 语料库，其中包含超过 340M 个三元组，是目前公开可用的最大的 OIE 语料库。我们发现，在 OPIEC 中存在的大多数实体之间的事实在 DBpedia 和 / 或 YAGO 中找不到。此外，OIE open relations 通常高度多义性。我们相信 OPIEC 语料库是未来自动知识库构建研究的有价值的资源。

Apr, 2019

利用语言增强的嵌入技术进行开放信息抽取

自然语言处理中的开放信息提取（OIE）通过引入预训练语言模型和语言特征，通过 Seq2Seq 预训练语言模型提升 OIE 架构性能，并在性能评估中获得了 24.9%、27.3% 和 14.9% 的改进。此外，还介绍了其他挑战，如利用语义依赖解析标签减少计算开销、创建干净的合成数据集以及探究 OIE 行为在结构化预测模型中的表现。

Mar, 2024

开放信息提取仍然适用规则

本研究提出了一种创新的 APRCOIE 模型，专门用于处理中文文本，通过自动生成抽取模式，可以处理各种复杂多样的中文语法现象，与现有的中文 OIE 模型相比，APRCOIE 表现更好并显著扩展了 OIE 性能的界限。

Mar, 2024

利用大型语言模型和一致的推理环境掌握开放信息提取任务

通过构建合适的推理环境，本文探索利用大型语言模型（LLMs）解决开放式信息抽取（OIE）问题，实验结果表明，相较于最先进的监督方法，我们的 6-shot 方法在标准 CaRB 基准上实现了 55.3 的 F1 分数，同时在 TACRED 和 ACE05 上实验结果显示，我们的方法可以自然地推广到其他信息抽取任务，并分别获得了 5.7 和 6.8 的 F1 分数提升。

Oct, 2023

2007 年至 2022 年的开放式信息抽取 -- 综述

本文系统综述了 2007 年至 2022 年间的开放信息提取技术，提出了基于信息来源的新分类方法，并总结了三种主要方法、当前流行的数据集和模型评估指标，展示了数据集、信息来源、输出形式、方法和评估指标等方面的未来发展方向。

Aug, 2022

神经开放信息抽取综述：当前状态与未来方向

这篇文章针对开放信息抽取 (OpenIE) 进行了广泛的综述，其中包括最先进的神经网络 OpenIE 模型、它们的设计决策及其优缺点，以及当前解决方案的局限性和 OpenIE 问题本身存在的问题。最后，我们列出了能够扩展其范围和适用性的最新趋势，为 OpenIE 领域的未来研究开辟了有前途的方向。

May, 2022

半开放的科技文本中关系提取初探

本研究针对科技文本的开放式关系抽取技术不足问题，将窄 IE 系统和开放式 IE 系统结合，提出了一种新的任务 —— 半开放式关系抽取，并应用于生物领域。研究在 FOBIE 数据集上，训练出能够提取生物学文本中重要关系和论述的最先进的窄 IE 系统，并在 10k 篇生物学开放式科技文本上运行窄 IE 系统和开放式 IE 系统，取得了过滤出 65% 的错误和无用开放式 IE 提取结果，并且发现保留下来的提取结果对于读者更有信息价值。

May, 2020