一个统一的正 - 无标签学习框架，用于具有不同水平标记的文档级关系提取

EMNLPOct, 2022

一个统一的正 - 无标签学习框架，用于具有不同水平标记的文档级关系提取

A Unified Positive-Unlabeled Learning Framework for Document-Level Relation Extraction with Different Levels of Labeling

PDF

Ye Wang, Xinxin Liu, Wenxin Hu, Tao Zhang

TL;DR本文首次使用正样本 - 未标记（PU）学习在文档级别关系抽取任务上，并提出了一种统一的 PU 框架 - Shift and Squared Ranking Loss Positive-Unlabeled（SSR-PU）学习。本方法考虑了数据集标记数据可能导致未标记数据的先验偏移问题，并使用了自适应阈值和平方排名损失，实验表明我们的方法相对于之前的基线在不完全标记的情况下提高了约 14 个 F1 分数，并且在完全监督和极端未标记设置下性能优于现有的方法。

Abstract

document-level relation extraction (RE) aims to identify relations between entities across multiple sentences. Most previous methods focused on document-level RE under full supervision. However, in real-world scenario, it is expensive and difficult to completely label all relations in

document-level relation extraction positive-unlabeled learning shift and squared ranking loss prior shift incomplete labeling

发现论文，激发创造

利用正例和无标签学习提高神经关系提取

该论文提出了一种新颖的方法，使用强化学习来决定句子是否与给定关系相关，借助正 / 无标签学习，该方法全面利用未标记实例，并提出了两种新的正 / 无标签包表示形式，将这两种表示形式以合适的方式组合来进行包级别的预测。实验结果显示，与几个竞争性基线相比，该新方法显着而一致地提高了性能。

Nov, 2019

基于正负未标注度量学习的文档级关系抽取框架

本文提出了一种基于 P3M 度量学习框架的文档级关系抽取方法，使用正向增强和混合方法进行正向无标签学习，改进了文档级关系抽取的 F1 分数。

Jun, 2023

使用正 - 未标记学习进行远程监督的命名实体识别

提出一种新的 PU 学习算法，用于使用未标记的数据和命名实体词典执行命名实体识别任务，该方法不需要词典标记每个句子中的所有实体，也不需要词典标记构成实体的所有单词。通过对四个公共 NER 数据集的实证研究，证明了该方法的有效性。

Jun, 2019

通过神经元正无标记学习实现文档集扩展的可扩展性评估和改进

本研究提出了一种将信息检索 (IR) 扩展为正无标记 (positive-unlabeled, PU) 学习的方法，即从正样本数据 (即查询文档) 和非标记数据 (IR 引擎返回的结果) 中学习二元分类器，然后应用于文本分类问题中，该方法在 PubMed 文摘的细粒度主题提取中表现有效。

Oct, 2019

UniRE: 实体关系抽取的统一标签空间

本文提出一种新型联合实体关系抽取模型，它将实体检测和关系分类合并到一个标签空间中，使用一个统一的分类器预测每个单元格的标签，并提出了一种有效的近似解码器，实验表明该模型在三个基准测试中取得了与最佳抽取器相当的准确率，并且速度更快。

Jul, 2021

学习双重检索模块用于半监督关系抽取

本文提出 DualRE，使用弱监督技术结合自我训练机制和多视图学习方法，在关系抽取任务中通过检索模块与原始关系预测模型的联合训练来提高模型的性能表现。实验结果表明，该方法有效地提高了模型的性能表现。

Feb, 2019

文档级关系抽取的无类别排名损失

该论文提出了一种新的多标签丢失函数，该函数鼓励每个预定义类别与无类别之间的标签置信度得分具有大的边际，从而实现了捕获标签相关性和基于上下文的标签预测阈值。

May, 2022

无监督关系抽取的孪生表示学习

无监督关系抽取中的 Siamese 表示学习框架通过利用正样本对关系表示进行学习，有效优化实例的关系表示并保留了关系特征空间中的层次信息，取得了显著的研究成果。

Oct, 2023

重新审视远程监督关系抽取的负数据

本文提出了一种名为 ReRe 的管道方法，通过句子级别的关系检测和主谓对象提取来实现样本有效训练，将关系抽取问题转化为正无标记学习任务，缓解了负样本引起的误差问题，实验结果表明，该方法能够持续超越现有方法并且即使在学习大量的假阳性样本时仍保持良好的性能。

May, 2021

基于语义分割的文档级关系抽取

本研究提出基于 Entity-level Relation Matrix 与 U-shaped Network 的 Document-level Relation Extraction 模型，通过结合上下文信息以及全局关系，实现了在 DocRED，CDR 和 GDA 三个基准数据集上的最优性能。

Jun, 2021