ICLROct, 2022

从一开始进行持续的伪标签化

TL;DR本文提出了动态控制自训练过程中伪标签(PL)进化的方法,该方法避免了在低资源设置下过拟合到有标记的数据集。通过在线更改 PL 来控制 PL 缓存的会员资格和改善泛化能力。在预测分布中采样可进一步稳定训练,这两种技术使我们的自训练模型与之前的工作不相上下。