神经开放信息提取
这篇文章针对开放信息抽取 (OpenIE) 进行了广泛的综述,其中包括最先进的神经网络 OpenIE 模型、它们的设计决策及其优缺点,以及当前解决方案的局限性和 OpenIE 问题本身存在的问题。最后,我们列出了能够扩展其范围和适用性的最新趋势,为 OpenIE 领域的未来研究开辟了有前途的方向。
May, 2022
通过将 OpenIE 任务形式巧妙地转换为 T5 模型的预训练任务形式,并引入锚点的创新概念,OK-IE 显著减少了对大量训练数据的需求,消除了模型收敛速度慢的问题,实验结果显示,相较于之前的 SOTA 方法,OK-IE 仅需 1/100 的训练数据量(900 个实例)和 1/120 的训练时间(3 分钟)即可达到可比较的结果。
Oct, 2023
NeurON 是一个从问题 - 答案数据对中提取元组的系统,它使用多源序列到序列学习任务将问题和答案的分布式表示组合在一起以生成知识事实,并比其他最先进的 OpenIE 方法找到更多新的有趣事实来扩展知识库。
Mar, 2019
本研究使用多视图学习将从开放域语句中提取的关系元组所需的句法信息从成分结构和依赖关系树映射到词级别的图中并进行拓展,达到更好地融合此类信息的目的。实验证明,这种多视图学习的方法与使用多种信息源构建元组是非常有效的。
Dec, 2022
本研究提出了一种 Open IE 推理方法,利用最近提出的支持图优化框架进行 QA,从而使得可以更有效地处理所提出的方法中所述的多种难度级别的复杂问题。同时本方法不依赖于手动策划的知识。
Apr, 2017
本研究针对科技文本的开放式关系抽取技术不足问题,将窄 IE 系统和开放式 IE 系统结合,提出了一种新的任务 —— 半开放式关系抽取,并应用于生物领域。研究在 FOBIE 数据集上,训练出能够提取生物学文本中重要关系和论述的最先进的窄 IE 系统,并在 10k 篇生物学开放式科技文本上运行窄 IE 系统和开放式 IE 系统,取得了过滤出 65% 的错误和无用开放式 IE 提取结果,并且发现保留下来的提取结果对于读者更有信息价值。
May, 2020
本文通过实证调查神经 OpenIE 模型、训练集和基准,旨在为用户选择最适合其应用的 OpenIE 系统提供帮助。我们发现,不同模型和数据集所做的不同假设对性能有显着影响,这使得选择最适合自己应用的模型至关重要。我们在下游复杂 QA 应用程序中演示了我们建议的适用性。
Nov, 2022
本文提出了一种基于计算机视觉中的物体检测算法启发的一种新型单遍 OpenIE 方法,并使用基于二分图匹配的无序损失和基于 Transformer 的编码器体系结构进行序列标记。 该方法更快速并在标准基准测试中表现出优异的性能。我们还在两种语言的零 - shot 设置中对其进行了多语言版本的评估,并在多语言 Re-OIE2016 上展示了性能提高 15%,使两种语言的 F1 值均达到 75%以上。
Jun, 2022