DASO: 面向语义的分布感知假标签在非平衡半监督学习中的应用

CVPRJun, 2021

DASO: 面向语义的分布感知假标签在非平衡半监督学习中的应用

DASO: Distribution-Aware Semantics-Oriented Pseudo-label for Imbalanced Semi-Supervised Learning

Youngtaek Oh, Dong-Jin Kim, In So Kweon

TL;DR本文提出了一种基于 Distribution-Aware Semantics-Oriented (DASO) Pseudo-label 的伪标签框架，该框架能够减少分类器的偏差预测，特别是在类不平衡和分布不匹配时，能够可靠地提高半监督学习算法的表现。

Abstract

The capability of the traditional semi-supervised learning (SSL) methods is far from real-world application due to severely biased pseudo-labels caused by (1) class imbalance and (2) class →

semi-supervised learning pseudo-labeling framework class imbalance distribution mismatch daso

发现论文，激发创造

基于伪标签的分布对齐制造厂对半监督不平衡学习的改进

本文提出一种用于解决由不平衡数据分布训练的半监督学习算法的不足的算法，称为分布对齐伪标签提炼（DARP），该算法可以优化伪标签，保证效率和准确性，并且与现有 SSL 算法兼容。

Jul, 2020

基于偏差伪标签的半监督语义分割重分布：基线调查

本文提出了一种分布对齐与随机采样方法 (DARS), 用于生产能够匹配标记数据的真实分类分布的无偏伪标签，同时也提出了一种渐进式数据增强和标签策略，以促进使用伪标签训练模型。实验结果表明，该方法在 Cityscapes 和 PASCAL VOC 2012 数据集上的表现优于现有的前沿方法。

Jul, 2021

具有偏差自适应分类器的不平衡半监督学习

本文提出了一种基于偏差自适应分类器的伪标签半监督学习方法，通过引入一个偏差吸引器来自动补偿类别不平衡带来的偏差，从而提高了伪标签方法在类别不平衡情况下的性能。实验证明，该方法优于现有的基准方法。

Jul, 2022

面向半监督多标签学习的类别分布感知伪标记

本文提出 Class-distribution-Aware Pseudo Labeling (CAP) 方法，通过设计基于类感知阈值的规则学习框架来控制每个类别的伪标签的数量，并约束伪标签的类别分布接近真实分布，旨在解决半监督多标签学习问题。实验结果证明了 CAP 方法可以有效解决半监督多标签学习问题并提高泛化能力。

May, 2023

同时对一切进行对齐、蒸馏和增强以进行不平衡半监督学习

这篇研究提出了一种名为 ADALLO 的三方案框架，可解决长尾半监督学习中的类别不平衡问题，其中包括一个灵活的分布对齐机制、一个软一致性正则化机制和一个扩展未标记集的架构。该框架在不同程度的类别不平衡，不同数量的标记数据和分布不匹配的情况下在几个基准数据集上进行了评估，并展示了在大分布不匹配的情况下提高不平衡半监督学习表现的显著成果。

Jun, 2023

一种极为简单的半监督不平衡学习基线模型

SimiS 是一种简单而有效的 SSL 算法，通过用伪标签补充数据以解决类别不平衡问题，在 CIFAR100-LT，FOOD101-LT 和 ImageNet127 数据集上分别相对现有方法提高了 12.8％，13.6％和 16.7％的表现。

Nov, 2022

半监督目标检测中伪标签的思考

本文提出了一种基于置信度的伪标签方法，用于目标检测任务中的半监督目标检测。相较于现有方法，我们的方法可以更好地估计伪标签的分类和定位质量，并根据估计结果调整伪标签产生的阈值和权重，从而缓解类别不平衡和定位精度的问题。我们的实验结果表明，在 COCO 和 PASCAL VOC 数据集上，本方法可以使半监督目标检测的性能提升 1-2% AP，在有限标注的情况下，即使只使用 COCO 的 1-10% 标记数据，我们的方法也能将有监督基线方法的性能提高 10% AP。

Jun, 2021

SPLAL：基于相似性的伪标签与对齐损失在半监督医学图像分类中的应用

在这篇论文中，我们提出了一种新颖的半监督学习方法 SPLAL，用于医学图像分类。SPLAL 通过利用类原型和分类器的加权组合，在部分无标签图像上预测可靠的伪标签。此外，我们引入了对齐损失以减少对多数类的模型偏差。实验结果表明，我们的方法在准确率和 F1 分数上显著优于几种最先进的半监督学习方法。

Jul, 2023

DP-SSL: 面向用少量标注样本提升鲁棒性的半监督学习

本文提出了一种新的半监督学习方法 DP-SSL，采用创新的数据编程（DP）方案为无标签数据生成概率标签，通过自动生成标签函数并解决不同标签之间的冲突，成功缓解了有限标签数据的问题，实验证明 DP-SSL 可以为无标签数据提供可靠标签和更好的分类性能。

Oct, 2021

关于伪标记在类别不匹配半监督学习中的应用

该论文以 Pseudo-Labeling 为代表的 SSL 方法为研究对象，探究了未标记的 Out-Of-Distribution 数据对于类异构 SSL 方法的影响。研究发现，不平衡的伪标签是 PL 方法存在的主要问题。本文提出了两个改进方法：Re-balanced Pseudo-Labeling 和 Semantic Exploration Clustering，来解决这一问题，最终在不同基准测试中实现了超越监督基线和最先进性能的稳定改进。

Jan, 2023