开放信息提取
本研究针对科技文本的开放式关系抽取技术不足问题,将窄 IE 系统和开放式 IE 系统结合,提出了一种新的任务 —— 半开放式关系抽取,并应用于生物领域。研究在 FOBIE 数据集上,训练出能够提取生物学文本中重要关系和论述的最先进的窄 IE 系统,并在 10k 篇生物学开放式科技文本上运行窄 IE 系统和开放式 IE 系统,取得了过滤出 65% 的错误和无用开放式 IE 提取结果,并且发现保留下来的提取结果对于读者更有信息价值。
May, 2020
这篇文章针对开放信息抽取 (OpenIE) 进行了广泛的综述,其中包括最先进的神经网络 OpenIE 模型、它们的设计决策及其优缺点,以及当前解决方案的局限性和 OpenIE 问题本身存在的问题。最后,我们列出了能够扩展其范围和适用性的最新趋势,为 OpenIE 领域的未来研究开辟了有前途的方向。
May, 2022
本研究探讨了最近开放信息提取方法(OpenIE)如何通过将句子的结构信息编码为向量表示来改进关系提取(RE)的任务,实验结果表明,使用 OpenIE 以及 BERTFine-tune 的方法可以改善 RE 的效果。
Dec, 2022
本研究使用多视图学习将从开放域语句中提取的关系元组所需的句法信息从成分结构和依赖关系树映射到词级别的图中并进行拓展,达到更好地融合此类信息的目的。实验证明,这种多视图学习的方法与使用多种信息源构建元组是非常有效的。
Dec, 2022
通过将 OpenIE 任务形式巧妙地转换为 T5 模型的预训练任务形式,并引入锚点的创新概念,OK-IE 显著减少了对大量训练数据的需求,消除了模型收敛速度慢的问题,实验结果显示,相较于之前的 SOTA 方法,OK-IE 仅需 1/100 的训练数据量(900 个实例)和 1/120 的训练时间(3 分钟)即可达到可比较的结果。
Oct, 2023
本文提出了一种名为 ReMine 的新型 Open IE 系统,将本地上下文信号和全局结构信号统一到一个遥感监督的框架中,并利用外部知识库中的事实作为监督,通过联合优化问题解决实体 / 关系短语分割和元组提取质量评估的两个子任务,以提高从大型语料库中提取元组的质量,并在两种不同领域的实际语料库上进行实验以证明其有效性和鲁棒性。
Apr, 2018
本研究提出了一种 Open IE 推理方法,利用最近提出的支持图优化框架进行 QA,从而使得可以更有效地处理所提出的方法中所述的多种难度级别的复杂问题。同时本方法不依赖于手动策划的知识。
Apr, 2017