面向半监督学习的非随机缺失标签

ICCVAug, 2023

面向半监督学习的非随机缺失标签

Towards Semi-supervised Learning with Non-random Missing Labels

Yue Duan, Zhen Zhao, Lei Qi, Luping Zhou, Lei Wang...

TL;DR在 MNAR 场景中，通过基于类别转换跟踪的伪校正引导（PRG），利用马尔可夫随机游走建模的动态创建图来获取类别级的引导信息，从而提高 MNAR 中的伪标签质量并优化模型的性能。

Abstract

semi-supervised learning (SSL) tackles the label missing problem by enabling the effective usage of unlabeled data. While existing SSL methods focus on the traditional setting, a practical and challenging scenari

semi-supervised learning label missing problem label missing not at random (mnar)pseudo-rectifying guidance (prg)class transitions

发现论文，激发创造

非随机缺失标签上的多重填充半监督学习

该论文提出了两种结合多重填补模型的新方法，以实现更高的准确性和更少的偏差，其中一种方法利用多个填补模型创建置信区间，并应用阈值来忽略低置信度的伪标签，另一种方法通过过滤不准确的数据和找到准确可靠的子集来减少偏差，在 MCAR 和 MNAR 情况下显示出高效，实验证明该方法在分类准确性和减少偏差方面优于现有方法。

Aug, 2023

强化学习引导的半监督学习

提出了一种新颖的强化学习引导的半监督学习方法 RLGSSL，将半监督学习视为一个老虎机问题，并通过加权奖励的创新 RL 损失来自适应地指导预测模型的学习过程，通过在多个基准数据集上进行广泛实验表明，相较于最先进的半监督学习方法，我们的方法始终具有更好的性能。

May, 2024

朝着真实的半监督学习

本文提出一种基于伪标签的半监督学习方法，能够处理 open-world SSL 问题，并通过样本不确定性和类别分布先验知识等手段，为已知和未知类别的未标记数据生成可靠的类别分布感知型伪标签。该方法在多种常用数据集上表现良好，特别是在 CIFAR-100，ImageNet-100 和 Tiny ImageNet 数据集上的表现显著优于现有的最先进技术。

Jul, 2022

缺失非随机数据的填补和低秩估计

本文介绍了一种模型和代理的基于矩阵补全的方法来处理丢失而非随机的数据，该方法在处理不同类型的丢失机制时具有稳健性和计算效率，并通过一个实际案例从一个受伤人员数据库中预测是否给患有创伤性脑损伤的患者输注氨甲环酸以控制过度出血的情况。

Dec, 2018

缺失随机标签时的可靠半监督学习

本文介绍了一种半监督学习的方法，采用生成模型与监督学习算法，放松了对未标记特征的约束，可提高分类器的可靠性，从而准确量化标签不确定度。

Nov, 2018

基于伪标签的分布对齐制造厂对半监督不平衡学习的改进

本文提出一种用于解决由不平衡数据分布训练的半监督学习算法的不足的算法，称为分布对齐伪标签提炼（DARP），该算法可以优化伪标签，保证效率和准确性，并且与现有 SSL 算法兼容。

Jul, 2020

基于伪标签再生和 BEVMix 的半监督类别无关运动预测

本研究探索半监督学习在无类别依赖运动预测中的潜力，通过一致性自我训练范式、可靠伪标签选择和再生成模块以及数据增强策略，提出了一个半监督学习框架，其在使用较少标记数据的情况下能够超越自监督方法，并展现了与弱监督和一些全监督方法相当的性能水平，平衡了标注成本和性能的优点.

Dec, 2023

缺失非随机样本选择偏差下的鲁棒分类器

本篇论文提出了 BiasCorr 算法，解决了样本选择偏差中 MNAR 标签缺失的问题，该算法可以生成鲁棒的分类器，并可以超越目前在样本选择偏差领域的最佳算法。

May, 2023

元优化合成样本的生成半监督学习

我们提出了一种使用合成数据集来训练半监督学习模型的方法，该方法通过使用基于生成式基础模型训练的合成数据集来替代真实的未标记数据集，并证明了在极少标记数据集的情况下，合成样本比真实未标记数据更有效地提升性能。

Sep, 2023

SSR: 学习未知标签噪声的高效稳健框架

本文提出了一个基于 KNN 分类和参数化模型分类相结合的方法，命名为 Sample Selection and Relabelling（SSR），用于解决存在未知噪声数据的学习问题（Learning with Unknown Label Noise），该方法在 CIFAR10 / CIFAR100 以及 WebVision，Clothing1M 和 ANIMAL-10N 等真实世界噪声数据集上比以前的方法表现更好。

Nov, 2021