文档级关系抽取的无类别排名损失
本文提出了一种基于 P3M 度量学习框架的文档级关系抽取方法,使用正向增强和混合方法进行正向无标签学习,改进了文档级关系抽取的 F1 分数。
Jun, 2023
本文针对文档级关系抽取问题,设计一种具有高区分性和鲁棒性的方法,包括有效的损失函数,熵最小化和有监督对比学习,新颖的负标签采样策略,并在新的数据情境下进行评估。实验结果表明,该方法在 DocRED 数据集,Re-DocRED 和提出的数据情境下取得了最新的最优结果。
Apr, 2023
本文首次使用正样本 - 未标记(PU)学习在文档级别关系抽取任务上,并提出了一种统一的 PU 框架 - Shift and Squared Ranking Loss Positive-Unlabeled(SSR-PU)学习。本方法考虑了数据集标记数据可能导致未标记数据的先验偏移问题,并使用了自适应阈值和平方排名损失,实验表明我们的方法相对于之前的基线在不完全标记的情况下提高了约 14 个 F1 分数,并且在完全监督和极端未标记设置下性能优于现有的方法。
Oct, 2022
本文提出了一个半监督框架,包含三个新组件,针对文档级关系抽取任务进行优化,通过轴向注意力模块学习实体对之间的相互依赖关系、自适应 focal loss 解决 DocRE 的类别不平衡问题,以及使用知识蒸馏方法克服人工标注数据与远程监督数据之间的差异。在两个 DocRE 数据集上的实验证明我们的模型表现超过了强基线模型,并且在 DocRED 排行榜上的 F1 分数和 Ign_F1 分数分别增加了 1.36 和 1.46 分。
Mar, 2022
本文提出了一种新的自适应重新采样自训练框架,采用精度和召回率对每个类别的伪标签进行重新采样,以增加整体召回率而不过多牺牲精度,并在文件级别和生物医学关系提取数据集上进行实验表明,所提出的自训练框架在数据集的不完全注释时比现有方法表现要好。
Jun, 2023
我们提出了一种关系图方法,用于明确利用关系之间的相互依赖性,在文档级别关系抽取中考虑关系的相互关联,并通过关系图模型化关系之间的相关性,以及通过关系信息传播的关系相关矩阵的重要性。实验结果验证了我们的方法可以提高多关系抽取的性能,在文档级别关系抽取中考虑关系的相互关联的有效性。
Oct, 2023