结合监督学习与强化学习用于多标签分类任务中的部分标签

Jun, 2024

结合监督学习与强化学习用于多标签分类任务中的部分标签

Combining Supervised Learning and Reinforcement Learning for Multi-Label Classification Tasks with Partial Labels

Zixia Jia, Junpeng Li, Shichuan Zhang, Anji Liu, Zilong Zheng

TL;DR我们提出了基于强化学习的 RLAC 框架，通过结合强化学习的探索能力和监督学习的开发能力，解决了多标签正负样本学习问题，并在多个任务中进行实验证明了我们框架的泛化和有效性。

Abstract

Traditional supervised learning heavily relies on human-annotated datasets, especially in data-hungry neural approaches. However, various tasks, especially multi-label tasks like document-level relation extractio

supervised learning neural approaches multi-label positive-unlabelled learning rl-based framework reinforcement learning

发现论文，激发创造

面向不平衡的大规模多标签分类与部分标注的研究

研究了如何使用部分标签对神经网络进行训练，解决多标签分类中的标签不平衡问题，并提出了伪标注技术、新的损失函数和动态训练方案来优化模型性能。在多个公开数据集上进行了广泛实验，结果显示该方法优于现有的一些最先进方法，甚至在部分标注情况下超越了使用完整标签训练的方法。

Jul, 2023

PLMCL: 多标签图像分类的部分标签动量课程学习

本研究提出了一个新的部分标签学习的设置，其中只标注了训练图像的子集，每个图像只有一个正标签，其余训练图像保持未标注状态。通过使用端到端的深度神经网络 PLMCL，可以同时学习产生对部分标注和未标注的训练图像都具有信心的伪标签。通过考虑伪标签更新的速度，使用新的基于动量的法则来更新软伪标签，以帮助防止在早期训练阶段陷入低信心的局部最小值。此外，还提供了适应不同标签的逐渐递增学习的自适应 “自信度调度器”。实验结果表明，我们的 PLMCL 方法在三个不同数据集上的多标签分类中，表现比许多现有的基于多标签分类方法更好。

Aug, 2022

朝向深度监督异常检测：从部分标记异常数据中强化学习

该论文提出了一个基于深度强化学习的方法来解决在只有有限的异常样本和大量无标注数据集的情况下进行异常检测的问题，该方法在自动交互式模拟环境中学习已知异常，并通过探索从而将学习到的异常扩展到未知异常，最终取得了比五种已有方法更好的实验效果。

Sep, 2020

使用部分标签学习深度卷积神经网络进行多标签分类

该研究提出了一种使用部分标签进行多标签分类的方法，其中新的分类损失利用了每个示例已知标签的比例，并通过课程学习的策略预测遗漏标签。通过实验发现，该方法在 MS COCO、NUS-WIDE 和 Open Images 等三个大规模多标签数据集上取得了良好表现。

Feb, 2019

从部分注释的数据中学习多个密集预测任务

本研究提出了一种标签高效的方法，针对部分注释的数据（即每个图像不都有所有任务标签），在多个密集预测任务上联合学习，通过保留输入图像的高级信息，并成功利用任务关系对多任务学习进行监督学习的多任务训练程序。我们严格证明了我们的方法可以有效地利用具有未标记任务的图像，并且在三个标准基准测试中优于现有的半监督学习方法和相关方法。

Nov, 2021

基于强化学习的多模态特征融合网络用于新类别发现

利用深度学习技术和强化学习框架，该研究探索了未标记数据识别和分类的方法，实现了在开放域中对新类别的发现，通过多模态信息提取和融合特征，利用自监督学习和聚类方法来增强模型训练，通过环境反馈的奖励调整网络参数，确保对未知数据类别的学习准确性。研究结果在 3D 和 2D 领域的实验数据集上表现出良好的性能。

Aug, 2023

在线众包注释中不充分和模糊监督问题缓解方向

通过众包标注系统和基于伪标签和对比学习的新方法，解决了由于用户知识、文化背景差异和获得监督信息的高成本而导致的标注信息不充分和含糊不清的问题，实现了半监督部分标签学习的最先进表现。

Oct, 2022

自我引导下的部分标签学习

本文提出了一种新的方法，采用自我训练的方式来处理部分标签数据，其中采用了基于最大无穷范数的伪标签技术来自动实现基准标签的分类，并通过使用简单的二次规划方法进行拟合优化。通过在自制和真实世界数据集上的测试，证明了所提出的方法比现有的部分标签学习方法更加有效。

Feb, 2019

多个噪声部分标注者中学习

本文提出了一种基于概率生成模型的能够估计多个噪声偏差的部分标注工具并扩展了程序化弱监督的基础，通过对 3 个文本分类和 6 个对象分类任务的评估，证明了部分标注的效果可达到 8.6% 的平均准确率提高，进而探讨了部分标注在零样本对象分类任务中的应用以及与最新零样本学习方法相比的效果。

Jun, 2021

多标签分类只需要正标签

本文提出了一种名为正例与未标注多标签分类（PU-MLC）的新方法，通过在训练时直接丢弃训练集中的负标签来减少嘈杂的标签所带来的不良影响，并通过引入自适应重平衡因子和自适应温度系数来缓解标签分布中的灾难性不平衡和概率平滑问题。大量的实验证明了 PU-MLC 方法在 MS-COCO 和 PASCAL VOC 数据集上取得了显着的改进。

Jun, 2023