平滑伪标签
我们提出了一种轻量级通道级集成方法,用于将多个次优的伪标签有效地合并为理论上保证的无偏差和低方差的伪标签,该方法可轻松扩展到任何半监督学习框架,并在 CIFAR10/100 上显著优于现有技术,无论是在效果上还是效率上。
Mar, 2024
该研究论文通过半监督学习中的一种简单的组合方法 —— 一致性正则化和伪标记生成,提出了 FixMatch 算法,该算法可有效提高网络模型的性能,且在多项半监督学习标准测试中均实现了最先进的表现。
Jan, 2020
本文介绍了基于样本加权统一公式的伪标签方法及其 inherent quantity-quality trade-off 问题,并提出了利用截断高斯函数对置信度加权以实现软的置信度阈值。加强了弱学习类别的利用,在图像分类、文本分类和非平衡分类等多种基准测试中都取得了显著的改进。
Jan, 2023
本文提出一种自适应阈值调整方法 FreeMatch,以更好地利用未标记数据,另外还引入了自适应类公平性正则化惩罚来促进模型多样性预测。实验证明 FreeMatch 相对于最新的 FlexMatch 方法在 CIFAR-10、STL-10 和 ImageNet 上均表现更加优越,可提高不平衡 SSL 的性能。
May, 2022
提出了一种基于插值方法的半监督学习算法来解决使用一些标签的数据集时一致性正则化方法的性能问题,并设计了一种新型对比损失来引导学习网络嵌入样本,实现更好的边界决策能力,通过实验证明,与现有算法相比,该算法可提高分类准确率 5.3% 以上。
Feb, 2022
对 FixMatch 在半监督学习(SSL)基准测试中的成果进行了改进,提出了一种基于课程学习的伪标记方法(CPL),以便根据模型的学习状态利用未标记数据。在多个 SSL 基准测试中,CPL 可以提升 FlexMatch 性能并显著加速收敛速度。
Oct, 2021
本文提出了 FlatMatch 方法,通过最小化交叉尖锐度度量来保持两个数据集的一致学习性能,增加标记数据上的经验风险以获得一种最坏模型,然后利用未标记数据的丰富性惩罚最坏模型与原始模型之间的预测差异,从而使学习方向有利于未标记数据的泛化,进而校准学习过程,缓解不匹配的学习性能,进一步实现对未标记数据的有效利用和提高 SSL 性能。经过综合验证,我们展示了 FlatMatch 在许多 SSL 设置中实现了最先进的结果。
Oct, 2023
本文介绍了一种基于聚类原型的无监督选择性标注方法,通过它来提高半监督学习的效率。该方法能够在没有标记数据的情况下,选择代表性和多样性数据作为标记数据,显著改进了现有的半监督学习方法的性能。
Oct, 2021
本文提出一种基于不确定性的假标签选择框架,通过减少训练过程中的噪音来提高假标签的准确性,并可以生成负假标签用于多标签分类和负学习,相比于最近的半监督学习方法在 CIFAR-10、CIFAR-100、UCF-101 和 Pascal VOC 数据集上获得了很好的性能。
Jan, 2021
该论文提出两种新的技术(即熵值含义损失和自适应负样本学习),以更好地利用所有未标记的样本,并把它们与前沿的 FixMatch 框架相结合,通过多次实验在多个常见的 SSL 基准上表现出优越性能。
Mar, 2023