基于准确语料库的开放信息提取的跨度模型
通过将 OpenIE 任务形式巧妙地转换为 T5 模型的预训练任务形式,并引入锚点的创新概念,OK-IE 显著减少了对大量训练数据的需求,消除了模型收敛速度慢的问题,实验结果显示,相较于之前的 SOTA 方法,OK-IE 仅需 1/100 的训练数据量(900 个实例)和 1/120 的训练时间(3 分钟)即可达到可比较的结果。
Oct, 2023
这篇文章针对开放信息抽取 (OpenIE) 进行了广泛的综述,其中包括最先进的神经网络 OpenIE 模型、它们的设计决策及其优缺点,以及当前解决方案的局限性和 OpenIE 问题本身存在的问题。最后,我们列出了能够扩展其范围和适用性的最新趋势,为 OpenIE 领域的未来研究开辟了有前途的方向。
May, 2022
本文提出了一种基于计算机视觉中的物体检测算法启发的一种新型单遍 OpenIE 方法,并使用基于二分图匹配的无序损失和基于 Transformer 的编码器体系结构进行序列标记。 该方法更快速并在标准基准测试中表现出优异的性能。我们还在两种语言的零 - shot 设置中对其进行了多语言版本的评估,并在多语言 Re-OIE2016 上展示了性能提高 15%,使两种语言的 F1 值均达到 75%以上。
Jun, 2022
通过构建合适的推理环境,本文探索利用大型语言模型(LLMs)解决开放式信息抽取(OIE)问题,实验结果表明,相较于最先进的监督方法,我们的 6-shot 方法在标准 CaRB 基准上实现了 55.3 的 F1 分数,同时在 TACRED 和 ACE05 上实验结果显示,我们的方法可以自然地推广到其他信息抽取任务,并分别获得了 5.7 和 6.8 的 F1 分数提升。
Oct, 2023
本研究使用多视图学习将从开放域语句中提取的关系元组所需的句法信息从成分结构和依赖关系树映射到词级别的图中并进行拓展,达到更好地融合此类信息的目的。实验证明,这种多视图学习的方法与使用多种信息源构建元组是非常有效的。
Dec, 2022
自然语言处理中的开放信息提取(OIE)通过引入预训练语言模型和语言特征,通过 Seq2Seq 预训练语言模型提升 OIE 架构性能,并在性能评估中获得了 24.9%、27.3% 和 14.9% 的改进。此外,还介绍了其他挑战,如利用语义依赖解析标签减少计算开销、创建干净的合成数据集以及探究 OIE 行为在结构化预测模型中的表现。
Mar, 2024