强化学习引导的半监督学习

May, 2024

Reinforcement Learning-Guided Semi-Supervised Learning

Marzi Heidari, Hanping Zhang, Yuhong Guo

TL;DR提出了一种新颖的强化学习引导的半监督学习方法 RLGSSL，将半监督学习视为一个老虎机问题，并通过加权奖励的创新 RL 损失来自适应地指导预测模型的学习过程，通过在多个基准数据集上进行广泛实验表明，相较于最先进的半监督学习方法，我们的方法始终具有更好的性能。

Abstract

In recent years, semi-supervised learning (SSL) has gained significant attention due to its ability to leverage both labeled and unlabeled data to improve model performance, especially when labeled data is scarce. However, most current SSL methods rely on heuristics or predefined rules

semi-supervised learning reinforcement learning rlgssl one-armed bandit problem benchmark datasets

发现论文，激发创造

基于图的半监督学习：综述

本文着重阐述了基于图的半监督学习方法的各种变体及其概述、连接和发展方向。新的广义分类方法为图正则化和图嵌入方法提供了指导和最新的研究参考。

Feb, 2021

半监督学习的通用奖励模型：SemiReward

提出了一种 SemiReward 半监督奖励框架，通过预测奖励分数来评估和过滤高质量伪标签，以解决在半监督学习中确认偏差问题，实现高质量标签、快速收敛和任务多样性。

Oct, 2023

深度半监督学习算法的实际评估

通过实现多种常用的 SSL 技术并在一系列实验中进行测试，研究发现简单基线方法的表现通常被低估，而 SSL 方法对标记和未标记数据的敏感性不同，当未标记数据集包含类外示例时性能可能会显著下降，因此我们提供了一个公共代码重现平台以帮助实现 SSL 技术在实际应用中的可行性。

Apr, 2018

FlexSSL: 泛化高效的半监督学习框架

通过构建一个半合作的 “游戏”，FlexSSL 旨在解决半监督学习中标签可观察性的辨别问题，从而充分利用标注和未标注数据，并通过理论推导证明了它与噪声标签上的损失重新加权的联系，通过在不同任务上的评估，我们证明了 FlexSSL 可以持续增强半监督学习算法的性能。

Dec, 2023

带有少量标注的半监督学习

本文提出一种新的 SSL 算法，通过引入转移学习和自主监督来初始化数据的表示，再利用新算法，交替拟合有标签和无标签点以降低过拟合和避免标签和无标签损失平衡的问题。实验证明，该方法在标准基准测试中表现优异，特别是在从其他任务或数据集中细化时，效果更佳。

May, 2019

朝着真实的半监督学习

本文提出一种基于伪标签的半监督学习方法，能够处理 open-world SSL 问题，并通过样本不确定性和类别分布先验知识等手段，为已知和未知类别的未标记数据生成可靠的类别分布感知型伪标签。该方法在多种常用数据集上表现良好，特别是在 CIFAR-100，ImageNet-100 和 Tiny ImageNet 数据集上的表现显著优于现有的最先进技术。

Jul, 2022

通过不确定性量化来辅助半监督学习

本文提出了一种基于不确定性感知的新型无监督目标函数，结合最近 SSL 技术，在保证计算效率的同时，在基准数据集中表现优于或与现有最先进技术水平相当，尤其在复杂数据集如 CIFAR-100 和 Mini-ImageNet 上表现最好。

Jul, 2022

元优化合成样本的生成半监督学习

我们提出了一种使用合成数据集来训练半监督学习模型的方法，该方法通过使用基于生成式基础模型训练的合成数据集来替代真实的未标记数据集，并证明了在极少标记数据集的情况下，合成样本比真实未标记数据更有效地提升性能。

Sep, 2023

少样本零样本情境中的半监督学习

我们通过引入额外的熵损失构建了一个分类器，用于对来自已知和未知类别的数据进行分类，从而改进了现有的半监督学习方法在已知和未知类别的分类中的表现。通过在 CIFAR-100 和 STL-10 两个基准图像分类数据集上的实验证明，我们相对于现有的 SSL、开放集合 SSL 和开放世界 SSL 方法取得了巨大的改进。当标记数据非常有限（每个类别 1-25 个标记示例）时，进步最为显著。

Aug, 2023

寻求结构：联合学习图形结构和半监督分类

本文提出了一种新的并行图学习框架 (PG-learn)，具有基于梯度的优化边缘权重和自适应资源分配方案的并行超参数搜索算法，能显著提高图构建的准确性和高效扩展到高维问题。

Sep, 2019