通过增强分布对齐的半监督学习
本文提出一种新的特征分布对齐方法,用于在只有少量标记样本时避免过度拟合,已在 CIFAR10 和 SVHN 数据集上进行了测试,结果表明在 SVHN 数据集上取得了接近完全监督模型的测试错误率,并提供了关于特征分布对齐发生的理论洞察,并证明了我们的方法可以减少它。
Dec, 2019
这篇研究提出了一种名为 ADALLO 的三方案框架,可解决长尾半监督学习中的类别不平衡问题,其中包括一个灵活的分布对齐机制、一个软一致性正则化机制和一个扩展未标记集的架构。该框架在不同程度的类别不平衡,不同数量的标记数据和分布不匹配的情况下在几个基准数据集上进行了评估,并展示了在大分布不匹配的情况下提高不平衡半监督学习表现的显著成果。
Jun, 2023
我们提出了标签梯度对齐算法,它是一种半监督学习算法,用于为未标记的数据进行标记,然后用这些标记进行训练,将梯度模型转换成了一个具有语义意义的距离度量,通过梯度下降求解来对标记进行半监督学习, 在半监督 CIFAR-10 分类中实现了最先进的准确性。
Feb, 2019
本文提出基于分布对齐和数据增广锚定的混合增广半监督学习算法 ReMixMatch ,通过学习增广策略提高数据效率,实验结果表明其比之前算法更为高效。
Nov, 2019
本文提出了一种基于 Co-Distribution Alignment (Co-DA) 的半监督医学图像分割方法,通过对无标签数据和有标签数据的边际预测进行类别对齐,并设计了过度期望交叉熵损失来减少伪标签中的噪声,实验结果表明该方法在多个公共数据集上优于现有半监督医学图像分割方法。
Jul, 2023
本文提出了一种分布对齐与随机采样方法 (DARS), 用于生产能够匹配标记数据的真实分类分布的无偏伪标签,同时也提出了一种渐进式数据增强和标签策略,以促进使用伪标签训练模型。实验结果表明,该方法在 Cityscapes 和 PASCAL VOC 2012 数据集上的表现优于现有的前沿方法。
Jul, 2021
本文提出一种用于解决由不平衡数据分布训练的半监督学习算法的不足的算法,称为分布对齐伪标签提炼(DARP),该算法可以优化伪标签,保证效率和准确性,并且与现有 SSL 算法兼容。
Jul, 2020
提出一种基于自我训练的半监督学习框架,通过改变向量空间中边缘预测的基础,捕捉有关标记和未标记数据的类依赖性边缘预测,以避免对多数类别的偏见,从而解决医学图像分类中的数据注释耗时和类别分布不平衡的问题。
Jul, 2023
本文提出了一种半监督的方法 ASS 来处理域自适应问题,使用语义级别的对抗学习来提高全局和局部特征的分布一致性,从而更好地减轻源域和目标域之间的数据分布差异。实验结果表明,使用少量的注释样本,ASS 可以显著优于目前的无监督方法,并可以通过增加目标域的注释样本克服针对源域的过度拟合.
Apr, 2020
提出了一种无需超参数、适用于匹配和不匹配类分布的相互分布对齐 (RDA) 框架,使用两个分类器共同预测未标记数据上的伪标签和互补标签,从而实现这两个携带互补信息的分布互相规范化,解决了分布不匹配问题,可在半监督学习和常规匹配学习设置下的广泛情形中取得优异的表现,同时最大化了输入 - 输出的互信息。
Aug, 2022