关系分类中的众包语义标签传播

EMNLPSep, 2018

Crowdsourcing Semantic Label Propagation in Relation Classification

Anca Dumitrache, Lora Aroyo, Chris Welty

TL;DR该研究使用 CrowdTruth 方法将人类注释信号扩展到相似的低维空间中的句子，从而显着提高了句级多类关系分类器的性能。

Abstract

distant supervision is a popular method for performing relation extraction from text that is known to produce noisy labels. Most progress in relation extraction and classification has been made with crowdsourced

relation extraction distant supervision crowdtruth methodology annotation signals multi-class relation classifier

发现论文，激发创造

使用语义标签传播技术进行知识库填充

本研究讨论了使用远程监督和特征标注相结合的方法解决知识库填充问题，提出了一种名为语义标签传播的方法，并在实验中显示出了显著的性能提升。

Nov, 2015

远程监督数据中的假阳性和交叉关系信号

本文探讨了远程监督关系提取中数据质量的两个问题以及如何使用 CrowdTruth 度量来改善；同时，使用 CrowdTruth 改善了关系分类模型的训练数据。

Nov, 2017

利用推理学习改进远程监督

本文提出了一种使用知识推理方法检测潜在误差样本的方法，以提高使用远程监督数据训练关系提取系统的性能。

Sep, 2015

深度强化学习下的强健远程监督关系抽取

研究利用深度强化学习策略生成假阳性指标解决远程监督产生的噪声，进而将它们分配为负面样本以解决误报问题，实验表明该方法显著提高了远程监督方法的性能。

May, 2018

利用远程监督进行神经关系分类的元学习

该论文提出了一种基于元学习的方法来重新加权具有噪声标签的训练数据，以选择更可靠的训练实例，并利用动态提取的可靠精英实例扩充手工标注的参考数据，从而在关系分类方面取得了领先的性能。

Oct, 2020

关系抽取中充分利用领域专家的时间

文章介绍了一种使用远程监督与主动学习相结合的方法进行关系提取，实现在减少专家标注数据的人力成本的同时，使神经网络在复杂数据集上得到更好的表现。

Jul, 2018

增强文档级关系抽取的高效多重监督

提出了高效的多监督关系抽取方法，通过融合远程监督和专家监督选择信息丰富的文档子集，并利用多方监督排名损失训练模型，以提高模型性能并具有较高的时间效率。

Jul, 2024

一种基于数据驱动的方法用于远程监督下的生物医学关系抽取中的噪声削减

使用多实例学习和 BERT 模型，我们提出了一个简单的数据编码方案，以降低噪音并获得了远程监控生物医学关系提取的最新性能，同时进一步编码关于关系三元组方向的知识，从而减少噪音并减轻了与知识图完成的联合学习的需要。

May, 2020

MedDistant19：面向广泛覆盖的医学关系抽取精准基准的研究

本研究针对生物医学领域中关系抽取的挑战，提出利用知识图谱关系对原始文本进行自动标注，以克服标注数据缺乏的问题，并通过构建更为准确的基准集 “MedDistant19” 来解决现有基准集存在的一系列问题，并验证了其在领域中具有普遍适用性。

Apr, 2022

场景图生成的视觉远程监督

本文提出了一种视觉远程监督的场景图生成方法，该方法可以在无需人工标注的情况下训练场景图模型，并且进一步通过半监督的方法与人工标注的数据相结合，取得了比现有全监督模型更好的效果。

Mar, 2021