联合实体和关系抽取的有效级联双解码器模型
本文提出了两种使用编码器 - 解码器结构的方法来共同提取关系元组和实体,其中第一种方法采用关系元组表示方案,使解码器能够像机器翻译模型一样逐个单词生成,并仍然找到具有不同长度和重叠实体的所有元组,而第二种方法采用指针网络解码方法,每个时间步长生成整个元组。实验结果表明,本文提出的方法优于先前的工作,并实现了显着更高的 F1 分数。
Nov, 2019
提出了一个新的级联二进制标记框架(CasRel)来解决关系三元组抽取任务中的重叠问题,并且在两个公共数据集 NYT 和 WebNLG 上相对于最强基线在 F1 分数上具有 17.5 和 30.2 绝对增益。
Sep, 2019
本研究提出基于 Entity-level Relation Matrix 与 U-shaped Network 的 Document-level Relation Extraction 模型,通过结合上下文信息以及全局关系,实现了在 DocRED,CDR 和 GDA 三个基准数据集上的最优性能。
Jun, 2021
本论文设计了一种评估过滤框架,将大型语言模型与小型模型整合在一起,用于处理关系三元组提取任务,以获得更准确的提取结果。评估模型能够高精度提取相关实体对,并通过简单的标注原则和深度神经网络对模型进行嵌入,将输出作为提示加入到大型模型的提取过程中。通过大量实验证明,该方法可以帮助大型语言模型从含有多个关系三元组的复杂句子中获得更准确的提取结果,同时也能够嵌入传统提取模型以提高其从复杂句子中的提取准确率。
Apr, 2024
本文提出了一种基于序列标注的分解策略,将联合实体和关系抽取任务划分为头实体抽取 (HR) 和尾实体及关系抽取 (TER) 两个子任务,这两个子任务进一步分解为多个序列标注问题以方便通过分层边界标签器和多跨度解码算法解决。实验表明,该方法在三个公共数据集上优于先前的工作,达到了 21.5% 的新最优 F1 分数。
Sep, 2019
本文提出一种用于实体抽取和关系提取的直接集合预测方法,通过应用 transformers 和非自回归并行解码的网络,以及基于二分图匹配的基于集合的损失函数,能更好地完成实体抽取和关系提取任务。
Nov, 2020
通过使用标准跨度机制和标记跨度机制、构建实体注意力机制,本研究提出了一种完全解决三元组重叠问题的信息抽取方法,并在两个公共数据集上进行了测试。该方法在这两个数据集上达到最佳性能。
Apr, 2023
本研究提出了一种简单的流水线方法来进行实体和关系抽取,并在标准基准测试中确立了新的最佳结果,通过对实体和关系进行不同的上下文表示,融合实体信息来提高性能,同时在全局上下文中引入信息以提高准确性。
Oct, 2020
本文提出了 DirectRel 模型,通过构建 “头实体→尾实体” 二分图的链接问题,直接在一步中提取所有的关系三元组,并在两个常用数据集上取得比现有技术更好的实验结果。
May, 2022
本研究提出了一种新的框架,Bi-Encoder-Decoder (BED),用于解决规范化关系提取中的实体信息利用、新实体表示、性能提升等问题。实验结果表明,该方法在两个数据集上性能显著优于之前的最优方法,并能够良好处理新实体而无需重新训练。
Dec, 2023