关系抽取中充分利用领域专家的时间

KDDJul, 2018

关系抽取中充分利用领域专家的时间

Making Efficient Use of a Domain Expert's Time in Relation Extraction

Linara Adilova, Sven Giesselbach, Stefan Rüping

TL;DR文章介绍了一种使用远程监督与主动学习相结合的方法进行关系提取，实现在减少专家标注数据的人力成本的同时，使神经网络在复杂数据集上得到更好的表现。

Abstract

Scarcity of labeled data is one of the most frequent problems faced in machine learning. This is particularly true in relation extraction in text mining, where large corpora of texts exists in many application do

relation extraction text mining labeled data convolutional neural network active learning

发现论文，激发创造

使用领域不变卷积神经网络从临床文本中提取关系

本文旨在探讨在医疗临床记事本上提取关系的问题。作者提出使用卷积神经网络自动学习特征，减少对人工特征工程的依赖，并针对 i2b2-2010 临床关系提取挑战数据集进行了实证研究。结果表明，卷积神经网络可以是在临床文本中提取关系的良好模型，而且不需要专家们定义的高质量特征。

Jun, 2016

远程监督在时态关系抽取中的有效应用

本研究提出了一种自动收集时间关系远程监督例子的方法，通过掩盖文本中明确的时间提示信号，训练出的模型能够学习到其他信号，实验表明预训练的 Transformer 模型能够通过这些弱标注的例子，在零样本和少样本情况下转移学习到具有人工注释的基准，并且遮罩方案对于改善泛化能力很重要。

Oct, 2020

增强文档级关系抽取的高效多重监督

提出了高效的多监督关系抽取方法，通过融合远程监督和专家监督选择信息丰富的文档子集，并利用多方监督排名损失训练模型，以提高模型性能并具有较高的时间效率。

Jul, 2024

基于预训练语言模型的上下文小样本关系抽取

通过预训练的语言模型，我们提出了一种新颖的在上下文中进行少样本关系抽取的框架，该框架可以消除命名实体识别和人工注释文档的需要，并实现了与现有方法相比最先进的性能。

Oct, 2023

深度强化学习下的强健远程监督关系抽取

研究利用深度强化学习策略生成假阳性指标解决远程监督产生的噪声，进而将它们分配为负面样本以解决误报问题，实验表明该方法显著提高了远程监督方法的性能。

May, 2018

关系分类中的众包语义标签传播

该研究使用 CrowdTruth 方法将人类注释信号扩展到相似的低维空间中的句子，从而显着提高了句级多类关系分类器的性能。

Sep, 2018

通过神经期望最大化框架揭示远程监督中的基本关系

本文介绍了一种使用神经网络和概率建模的新型标签去噪框架，以解决远程监督关系提取中标签嘈杂的问题，并在实践中证明了该方法的有效性。

Sep, 2019

FREDA: 灵活的关系抽取数据标注

本研究提出了一种方法，以便快速生成高质量数据集用于关系抽取任务，并训练神经模型以对所创建的数据集进行关系抽取来实现很好的结果，并广泛适用于其他数据集。研究中，我们能够在合理的时间内注释 10,022 个句子的 19 种关系，并为每种关系训练一个常用的基线模型。

Apr, 2022

MedDistant19：面向广泛覆盖的医学关系抽取精准基准的研究

本研究针对生物医学领域中关系抽取的挑战，提出利用知识图谱关系对原始文本进行自动标注，以克服标注数据缺乏的问题，并通过构建更为准确的基准集 “MedDistant19” 来解决现有基准集存在的一系列问题，并验证了其在领域中具有普遍适用性。

Apr, 2022

关系提取的深度学习方法综述

本文通过比较深度学习在关系抽取任务中的应用，探讨不同模型的优劣和限制，以指导未来方向。

May, 2017