Jan, 2020
课程标记: 重新审视半监督学习中的伪标记
Curriculum Labeling: Self-paced Pseudo-Labeling for Semi-Supervised
Learning
TL;DR本文重新审视了伪标记的概念,提出了一种基于半监督学习的方法,通过将伪标记应用于无标签集中的样本,并利用已训练好的模型标记这些样本,然后迭代重复此过程来训练模型。本文通过实验证明,伪标记方法可以取得与现有最先进方法相媲美甚至更好的结果,并且更能抵御未知分布样本。作者指出采用学习课程原理以及在每个自我训练周期前重启模型参数是实现这一点的两个关键因素。在CIFAR-10数据集上,本文仅使用了4,000个标记样本,达到了94.91%的准确率,在Imagenet-ILSVRC数据集上,本文仅使用了10%的标记样本,达到了68.87%的top-1的准确率。