开放信息抽取调查
本文系统综述了 2007 年至 2022 年间的开放信息提取技术,提出了基于信息来源的新分类方法,并总结了三种主要方法、当前流行的数据集和模型评估指标,展示了数据集、信息来源、输出形式、方法和评估指标等方面的未来发展方向。
Aug, 2022
这篇文章针对开放信息抽取 (OpenIE) 进行了广泛的综述,其中包括最先进的神经网络 OpenIE 模型、它们的设计决策及其优缺点,以及当前解决方案的局限性和 OpenIE 问题本身存在的问题。最后,我们列出了能够扩展其范围和适用性的最新趋势,为 OpenIE 领域的未来研究开辟了有前途的方向。
May, 2022
我们建立了一个公开信息提取的参考标准,解决了多个问题并生产了注释指南与评价脚本。在对七个系统进行比较后,我们发现 MinIE 表现最佳。
Sep, 2018
本研究提出了一种 Open IE 推理方法,利用最近提出的支持图优化框架进行 QA,从而使得可以更有效地处理所提出的方法中所述的多种难度级别的复杂问题。同时本方法不依赖于手动策划的知识。
Apr, 2017
该论文使用众包方法评估两种最先进的开放信息抽取系统在 10 个不同学科的科学文本上的性能,发现 OIE 系统在科学文本上的表现明显劣于百科全书文本,在提供错误分析并建议减少错误的领域的同时,提出了一个句子和判断的语料库。
Feb, 2018
本文通过实证调查神经 OpenIE 模型、训练集和基准,旨在为用户选择最适合其应用的 OpenIE 系统提供帮助。我们发现,不同模型和数据集所做的不同假设对性能有显着影响,这使得选择最适合自己应用的模型至关重要。我们在下游复杂 QA 应用程序中演示了我们建议的适用性。
Nov, 2022
通过将 OpenIE 任务形式巧妙地转换为 T5 模型的预训练任务形式,并引入锚点的创新概念,OK-IE 显著减少了对大量训练数据的需求,消除了模型收敛速度慢的问题,实验结果显示,相较于之前的 SOTA 方法,OK-IE 仅需 1/100 的训练数据量(900 个实例)和 1/120 的训练时间(3 分钟)即可达到可比较的结果。
Oct, 2023
这篇综述研究对最近的文档级信息抽取文献进行了系统回顾,通过与当前最先进的算法进行彻底的错误分析,确定它们的局限性以及文档级信息抽取任务的剩余挑战,包括标签误差、实体关联解析和缺乏推理,严重影响文档级信息抽取的性能。本综述的目标是为 NLP 研究人员提供更多见解,帮助进一步提高文档级信息抽取的性能。
Sep, 2023