本文提出了一种利用无监督深度聚类技术解决噪声标注问题的远程监督关系抽取模型,包括句子编码器、噪声检测器和标签生成器,实验证明该模型在常用基准数据集上优于现有的同类模型,并能够应对噪声标注问题。
Nov, 2019
本文提出了一种名为 ReRe 的管道方法,通过句子级别的关系检测和主谓对象提取来实现样本有效训练,将关系抽取问题转化为正无标记学习任务,缓解了负样本引起的误差问题,实验结果表明,该方法能够持续超越现有方法并且即使在学习大量的假阳性样本时仍保持良好的性能。
May, 2021
本文提出了一种 RNT 框架,采用未标注样本自动筛选和基于负样本训练的方法,解决了半监督文本分类中标注噪声和模型泛化问题。实验证明,该方法在多个数据集上具有显著的优势。
Jun, 2023
研究利用深度强化学习策略生成假阳性指标解决远程监督产生的噪声,进而将它们分配为负面样本以解决误报问题,实验表明该方法显著提高了远程监督方法的性能。
May, 2018
通过引入 Sub-Tree Parse 和基于迁移学习的先验知识,我们提出了一种新的基于词级级别远程监督的关系提取方法,可以从自动构建的包含噪声词语的低质量句子数据集中提取关系,实验结果表明我们的方法相对现有最优工作提高了 Precision/Recall (PR) 的面积从 0.35 到 0.39.
Aug, 2018
本文提出一种两阶段的远程监督关系抽取方法,利用深度神经网络的记忆机制和对抗训练解决当前知识库不完整所带来的假阴性问题,并在两个流行基准数据集上验证了方法的有效性。
Sep, 2021
本文提出了一种新的句子分布估计模型和全新的关系抽取器,通过较弱的远程监督假设以及两级强化学习模型选择正确标记的句子来解决嘈杂数据的影响,最终达到比基线模型更好的 n-ary 跨句子关系提取任务性能。
Sep, 2020
使用多实例学习和 BERT 模型,我们提出了一个简单的数据编码方案,以降低噪音并获得了远程监控生物医学关系提取的最新性能,同时进一步编码关于关系三元组方向的知识,从而减少噪音并减轻了与知识图完成的联合学习的需要。
May, 2020
本研究提出了一种新型的对抗训练机制用于关系提取,以减轻噪音问题,并在大规模基准数据集上进行了实验,表明我们的去噪方法可以有效过滤出嘈杂的实例,并与现有模型相比实现了显著的改进。
本研究提出了一种改进的神经网络关系抽取模型,该模型采用直接监督数据来提高注意力机制的性能,同时使用远程监督数据帮助识别噪声标注,实验结果在 FB-NYT 数据集上取得了最新的最优性能。
Oct, 2018