DASO: 面向语义的分布感知假标签在非平衡半监督学习中的应用
本文提出一种用于解决由不平衡数据分布训练的半监督学习算法的不足的算法,称为分布对齐伪标签提炼(DARP),该算法可以优化伪标签,保证效率和准确性,并且与现有 SSL 算法兼容。
Jul, 2020
本文提出了一种分布对齐与随机采样方法 (DARS), 用于生产能够匹配标记数据的真实分类分布的无偏伪标签,同时也提出了一种渐进式数据增强和标签策略,以促进使用伪标签训练模型。实验结果表明,该方法在 Cityscapes 和 PASCAL VOC 2012 数据集上的表现优于现有的前沿方法。
Jul, 2021
本文提出了一种基于偏差自适应分类器的伪标签半监督学习方法,通过引入一个偏差吸引器来自动补偿类别不平衡带来的偏差,从而提高了伪标签方法在类别不平衡情况下的性能。实验证明,该方法优于现有的基准方法。
Jul, 2022
本文提出 Class-distribution-Aware Pseudo Labeling (CAP) 方法,通过设计基于类感知阈值的规则学习框架来控制每个类别的伪标签的数量,并约束伪标签的类别分布接近真实分布,旨在解决半监督多标签学习问题。实验结果证明了 CAP 方法可以有效解决半监督多标签学习问题并提高泛化能力。
May, 2023
这篇研究提出了一种名为 ADALLO 的三方案框架,可解决长尾半监督学习中的类别不平衡问题,其中包括一个灵活的分布对齐机制、一个软一致性正则化机制和一个扩展未标记集的架构。该框架在不同程度的类别不平衡,不同数量的标记数据和分布不匹配的情况下在几个基准数据集上进行了评估,并展示了在大分布不匹配的情况下提高不平衡半监督学习表现的显著成果。
Jun, 2023
SimiS 是一种简单而有效的 SSL 算法,通过用伪标签补充数据以解决类别不平衡问题,在 CIFAR100-LT,FOOD101-LT 和 ImageNet127 数据集上分别相对现有方法提高了 12.8%,13.6%和 16.7%的表现。
Nov, 2022
本文提出了一种基于置信度的伪标签方法,用于目标检测任务中的半监督目标检测。相较于现有方法,我们的方法可以更好地估计伪标签的分类和定位质量,并根据估计结果调整伪标签产生的阈值和权重,从而缓解类别不平衡和定位精度的问题。我们的实验结果表明,在 COCO 和 PASCAL VOC 数据集上,本方法可以使半监督目标检测的性能提升 1-2% AP,在有限标注的情况下,即使只使用 COCO 的 1-10% 标记数据,我们的方法也能将有监督基线方法的性能提高 10% AP。
Jun, 2021
在这篇论文中,我们提出了一种新颖的半监督学习方法 SPLAL,用于医学图像分类。SPLAL 通过利用类原型和分类器的加权组合,在部分无标签图像上预测可靠的伪标签。此外,我们引入了对齐损失以减少对多数类的模型偏差。实验结果表明,我们的方法在准确率和 F1 分数上显著优于几种最先进的半监督学习方法。
Jul, 2023
本文提出了一种新的半监督学习方法 DP-SSL,采用创新的数据编程(DP)方案为无标签数据生成概率标签,通过自动生成标签函数并解决不同标签之间的冲突,成功缓解了有限标签数据的问题,实验证明 DP-SSL 可以为无标签数据提供可靠标签和更好的分类性能。
Oct, 2021
该论文以 Pseudo-Labeling 为代表的 SSL 方法为研究对象,探究了未标记的 Out-Of-Distribution 数据对于类异构 SSL 方法的影响。研究发现,不平衡的伪标签是 PL 方法存在的主要问题。本文提出了两个改进方法:Re-balanced Pseudo-Labeling 和 Semantic Exploration Clustering,来解决这一问题,最终在不同基准测试中实现了超越监督基线和最先进性能的稳定改进。
Jan, 2023