EMNLPOct, 2022

一个统一的正 - 无标签学习框架,用于具有不同水平标记的文档级关系提取

TL;DR本文首次使用正样本 - 未标记(PU)学习在文档级别关系抽取任务上,并提出了一种统一的 PU 框架 - Shift and Squared Ranking Loss Positive-Unlabeled(SSR-PU)学习。本方法考虑了数据集标记数据可能导致未标记数据的先验偏移问题,并使用了自适应阈值和平方排名损失,实验表明我们的方法相对于之前的基线在不完全标记的情况下提高了约 14 个 F1 分数,并且在完全监督和极端未标记设置下性能优于现有的方法。