利用强化学习从嘈杂数据中进行关系分类

Aug, 2018

利用强化学习从嘈杂数据中进行关系分类

Reinforcement Learning for Relation Classification from Noisy Data

Jun Feng, Minlie Huang, Li Zhao, Yang Yang, Xiaoyan Zhu

TL;DR本文提出了一种新的基于句子级别的关系分类模型，通过强化学习筛选高质量句子并将其输入到关系分类器中，实现了从嘈杂数据中对关系进行分类的效果优化。

Abstract

Existing relation classification methods that rely on distant supervision assume that a bag of sentences mentioning an entity pair are all describing a relation for the entity pair. Such methods, performing class

relation classification distant supervision noisy data sentence level reinforcement learning

发现论文，激发创造

嘈杂的句子是否对远程监督关系抽取毫无用处？

本文提出了一种利用无监督深度聚类技术解决噪声标注问题的远程监督关系抽取模型，包括句子编码器、噪声检测器和标签生成器，实验证明该模型在常用基准数据集上优于现有的同类模型，并能够应对噪声标注问题。

Nov, 2019

基于强化学习的 N 元交叉句子关系抽取

本文提出了一种新的句子分布估计模型和全新的关系抽取器，通过较弱的远程监督假设以及两级强化学习模型选择正确标记的句子来解决嘈杂数据的影响，最终达到比基线模型更好的 n-ary 跨句子关系提取任务性能。

Sep, 2020

深度强化学习下的强健远程监督关系抽取

研究利用深度强化学习策略生成假阳性指标解决远程监督产生的噪声，进而将它们分配为负面样本以解决误报问题，实验表明该方法显著提高了远程监督方法的性能。

May, 2018

利用正例和无标签学习提高神经关系提取

该论文提出了一种新颖的方法，使用强化学习来决定句子是否与给定关系相关，借助正 / 无标签学习，该方法全面利用未标记实例，并提出了两种新的正 / 无标签包表示形式，将这两种表示形式以合适的方式组合来进行包级别的预测。实验结果显示，与几个竞争性基线相比，该新方法显着而一致地提高了性能。

Nov, 2019

使用神经噪声转换器和条件最优选择器改进远程监督关系抽取

本文提出了一种基于神经噪声转换器方法和条件最优选择器的远程监督关系抽取方法，以减轻噪声数据造成的影响并帮助进行准确预测，实验证明该方法在大数据集中的效果显著提高。

Nov, 2018

应用内部句子噪声降低和转移学习的神经关系抽取

通过引入 Sub-Tree Parse 和基于迁移学习的先验知识，我们提出了一种新的基于词级级别远程监督的关系提取方法，可以从自动构建的包含噪声词语的低质量句子数据集中提取关系，实验结果表明我们的方法相对现有最优工作提高了 Precision/Recall (PR) 的面积从 0.35 到 0.39.

Aug, 2018

基于结构化最小监督学习的神经关系抽取

通过结合学习表示和结构化学习的优点，我们提出了一种最小监督关系抽取方法，可以在知识库提供的命题级监督下，准确地预测句子级别的关系提及。通过在学习期间明确地推理有关缺失数据，我们的方法能够在缓解远程监督的标签噪声的同时进行大规模的一维卷积神经网络训练。我们的方法在最小监督下的句子关系抽取方面实现了最新的成果，优于许多基线方法，包括仅使用神经模型的注意层的竞争方法。

Mar, 2019

利用远程监督进行神经关系分类的元学习

该论文提出了一种基于元学习的方法来重新加权具有噪声标签的训练数据，以选择更可靠的训练实例，并利用动态提取的可靠精英实例扩充手工标注的参考数据，从而在关系分类方面取得了领先的性能。

Oct, 2020

噪声鲁棒学习的远程监督联合实体和关系抽取

用一个模型识别实体对及其关系的联合实体和关系抽取任务中，存在嘈杂标签的问题。为了填补这个空白，我们引入了一种新的噪音鲁棒方法，可以同时进行实体和关系检测，并使用一个新的损失函数惩罚与显著关系模式和实体关系依赖性不一致的情况，以及一个自适应学习步骤迭代地选择和训练高质量实例。在两个数据集上的实验证明，我们的方法在联合抽取性能和噪音减少效果方面优于现有的最新方法。

Oct, 2023

一种基于数据驱动的方法用于远程监督下的生物医学关系抽取中的噪声削减

使用多实例学习和 BERT 模型，我们提出了一个简单的数据编码方案，以降低噪音并获得了远程监控生物医学关系提取的最新性能，同时进一步编码关于关系三元组方向的知识，从而减少噪音并减轻了与知识图完成的联合学习的需要。

May, 2020