长尾半监督学习中提升双重训练的一致性
我们提出了一种名为 CPE 的新方法,通过训练多个专家来解决长尾半监督学习中标签不平衡和未标记数据分布未知的问题,并引入 CPE 的类别批量归一化来避免特征分布不匹配造成的性能下降。在 CIFAR-10-LT、CIFAR-100-LT 和 STL-10-LT 数据集基准上,CPE 取得了最先进的性能,例如在 CIFAR-10-LT 上,与基线相比,CPE 将测试准确率提高了超过 2.22%。
Dec, 2023
这篇研究提出了一种名为 ADALLO 的三方案框架,可解决长尾半监督学习中的类别不平衡问题,其中包括一个灵活的分布对齐机制、一个软一致性正则化机制和一个扩展未标记集的架构。该框架在不同程度的类别不平衡,不同数量的标记数据和分布不匹配的情况下在几个基准数据集上进行了评估,并展示了在大分布不匹配的情况下提高不平衡半监督学习表现的显著成果。
Jun, 2023
本文提出了一种使用对比学习和越界数据解决长尾数据集中深度自我监督学习(Self-supervised learning)效果不佳的技术 COLT,实验表明该方法能够显著提高长尾数据集上自我监督学习的性能。
Jun, 2023
研究了在长尾标签分布下标签噪声问题,提出了一种新的原型噪声检测方法及一个鲁棒的框架,该框架通过软伪标签技术和半监督学习算法进一步提高了泛化性能,并且在基准和真实数据集上表现优于现有基线模型,尤其是比 DivideMix 模型测试精度高出 3%。
Aug, 2021
提出了一种基于平衡记忆库和自适应权重机制的半监督学习框架,其可以解决长尾数据对于 SSL 任务带来的数据不平衡问题,实验结果表明该框架在多个数据集上优于现有的方法。
May, 2023
SimiS 是一种简单而有效的 SSL 算法,通过用伪标签补充数据以解决类别不平衡问题,在 CIFAR100-LT,FOOD101-LT 和 ImageNet127 数据集上分别相对现有方法提高了 12.8%,13.6%和 16.7%的表现。
Nov, 2022
本文提出一种基于伪标签的半监督学习方法,能够处理 open-world SSL 问题,并通过样本不确定性和类别分布先验知识等手段,为已知和未知类别的未标记数据生成可靠的类别分布感知型伪标签。该方法在多种常用数据集上表现良好,特别是在 CIFAR-100,ImageNet-100 和 Tiny ImageNet 数据集上的表现显著优于现有的最先进技术。
Jul, 2022
基于不确定性感知的动态阈值选择 (UDTS) 方法解决了半监督学习中类别不平衡的问题,通过引入模型预测的不确定性来调整伪标签选择阈值,提高了模型在长尾类别上的准确性。
Jan, 2024
使用基于分布匹配的类原型和最优传输的伪标注方法,结合观察标签和伪标签的有效筛选标准,成功解决了长尾分布和标签噪声的联合问题,提供了更加平衡、准确的训练样本集,为具有标签噪声的长尾分类提供了有效的性能提升。
Apr, 2024