本研究讨论了使用远程监督和特征标注相结合的方法解决知识库填充问题,提出了一种名为语义标签传播的方法,并在实验中显示出了显著的性能提升。
Nov, 2015
本文探讨了远程监督关系提取中数据质量的两个问题以及如何使用 CrowdTruth 度量来改善;同时,使用 CrowdTruth 改善了关系分类模型的训练数据。
Nov, 2017
本文提出了一种使用知识推理方法检测潜在误差样本的方法,以提高使用远程监督数据训练关系提取系统的性能。
Sep, 2015
研究利用深度强化学习策略生成假阳性指标解决远程监督产生的噪声,进而将它们分配为负面样本以解决误报问题,实验表明该方法显著提高了远程监督方法的性能。
May, 2018
该论文提出了一种基于元学习的方法来重新加权具有噪声标签的训练数据,以选择更可靠的训练实例,并利用动态提取的可靠精英实例扩充手工标注的参考数据,从而在关系分类方面取得了领先的性能。
Oct, 2020
文章介绍了一种使用远程监督与主动学习相结合的方法进行关系提取,实现在减少专家标注数据的人力成本的同时,使神经网络在复杂数据集上得到更好的表现。
Jul, 2018
提出了高效的多监督关系抽取方法,通过融合远程监督和专家监督选择信息丰富的文档子集,并利用多方监督排名损失训练模型,以提高模型性能并具有较高的时间效率。
Jul, 2024
使用多实例学习和 BERT 模型,我们提出了一个简单的数据编码方案,以降低噪音并获得了远程监控生物医学关系提取的最新性能,同时进一步编码关于关系三元组方向的知识,从而减少噪音并减轻了与知识图完成的联合学习的需要。
May, 2020
本研究针对生物医学领域中关系抽取的挑战,提出利用知识图谱关系对原始文本进行自动标注,以克服标注数据缺乏的问题,并通过构建更为准确的基准集 “MedDistant19” 来解决现有基准集存在的一系列问题,并验证了其在领域中具有普遍适用性。
Apr, 2022
本文提出了一种视觉远程监督的场景图生成方法,该方法可以在无需人工标注的情况下训练场景图模型,并且进一步通过半监督的方法与人工标注的数据相结合,取得了比现有全监督模型更好的效果。
Mar, 2021