通过负样本训练进行句子级远程关系抽取

ACLJun, 2021

通过负样本训练进行句子级远程关系抽取

SENT: Sentence-level Distant Relation Extraction via Negative Training

Ruotian Ma, Tao Gui, Linyang Li, Qi Zhang, Yaqian Zhou...

TL;DR本文提出了一种远程关系抽取的句子级框架，其中包括使用负面训练（NT）对数据集进行清洗和重新标记。实验结果表明，该方法在句子级别评价和去噪效果上显著优于先前方法。

Abstract

distant supervision for relation extraction provides uniform bag labels for each sentence inside the bag, while accurate sentence labels are important for downstream applications that need the exact relation type

distant supervision relation extraction negative training sentence-level framework de-noising effect

发现论文，激发创造

嘈杂的句子是否对远程监督关系抽取毫无用处？

本文提出了一种利用无监督深度聚类技术解决噪声标注问题的远程监督关系抽取模型，包括句子编码器、噪声检测器和标签生成器，实验证明该模型在常用基准数据集上优于现有的同类模型，并能够应对噪声标注问题。

Nov, 2019

重新审视远程监督关系抽取的负数据

本文提出了一种名为 ReRe 的管道方法，通过句子级别的关系检测和主谓对象提取来实现样本有效训练，将关系抽取问题转化为正无标记学习任务，缓解了负样本引起的误差问题，实验结果表明，该方法能够持续超越现有方法并且即使在学习大量的假阳性样本时仍保持良好的性能。

May, 2021

半监督文本分类的排名感知负训练

本文提出了一种 RNT 框架，采用未标注样本自动筛选和基于负样本训练的方法，解决了半监督文本分类中标注噪声和模型泛化问题。实验证明，该方法在多个数据集上具有显著的优势。

Jun, 2023

深度强化学习下的强健远程监督关系抽取

研究利用深度强化学习策略生成假阳性指标解决远程监督产生的噪声，进而将它们分配为负面样本以解决误报问题，实验表明该方法显著提高了远程监督方法的性能。

May, 2018

应用内部句子噪声降低和转移学习的神经关系抽取

通过引入 Sub-Tree Parse 和基于迁移学习的先验知识，我们提出了一种新的基于词级级别远程监督的关系提取方法，可以从自动构建的包含噪声词语的低质量句子数据集中提取关系，实验结果表明我们的方法相对现有最优工作提高了 Precision/Recall (PR) 的面积从 0.35 到 0.39.

Aug, 2018

知晓假阴性：一种远程监督关系抽取的对抗训练方法

本文提出一种两阶段的远程监督关系抽取方法，利用深度神经网络的记忆机制和对抗训练解决当前知识库不完整所带来的假阴性问题，并在两个流行基准数据集上验证了方法的有效性。

Sep, 2021

基于强化学习的 N 元交叉句子关系抽取

本文提出了一种新的句子分布估计模型和全新的关系抽取器，通过较弱的远程监督假设以及两级强化学习模型选择正确标记的句子来解决嘈杂数据的影响，最终达到比基线模型更好的 n-ary 跨句子关系提取任务性能。

Sep, 2020

一种基于数据驱动的方法用于远程监督下的生物医学关系抽取中的噪声削减

使用多实例学习和 BERT 模型，我们提出了一个简单的数据编码方案，以降低噪音并获得了远程监控生物医学关系提取的最新性能，同时进一步编码关于关系三元组方向的知识，从而减少噪音并减轻了与知识图完成的联合学习的需要。

May, 2020

通过实例级对抗训练对关系抽取的远程监督进行去噪

本研究提出了一种新型的对抗训练机制用于关系提取，以减轻噪音问题，并在大规模基准数据集上进行了实验，表明我们的去噪方法可以有效过滤出嘈杂的实例，并与现有模型相比实现了显著的改进。

May, 2018

融合远程和直接监督的神经关系抽取

本研究提出了一种改进的神经网络关系抽取模型，该模型采用直接监督数据来提高注意力机制的性能，同时使用远程监督数据帮助识别噪声标注，实验结果在 FB-NYT 数据集上取得了最新的最优性能。

Oct, 2018