Jun, 2024

AllMatch: 充分利用所有未标记数据进行半监督学习

TL;DR现有的半监督学习算法采用伪标记和一致性调节技术来引入未标记样本的监督信号。本文通过对未标记数据的预测来估计模型的学习状态,并提出了一种基于类别的自适应阈值机制,同时设计了一种二元分类一致性调节方法来区分未标记样本中的候选类别。通过结合上述策略,我们提出了一种名为AllMatch的新型SSL算法,其改进了伪标记准确性并实现了未标记数据的100%利用率。我们在多个基准数据集上广泛评估了我们的方法,包括平衡和不平衡设置。结果表明,AllMatch始终优于现有的最先进方法。