May, 2024

强化学习引导的半监督学习

TL;DR提出了一种新颖的强化学习引导的半监督学习方法 RLGSSL,将半监督学习视为一个老虎机问题,并通过加权奖励的创新 RL 损失来自适应地指导预测模型的学习过程,通过在多个基准数据集上进行广泛实验表明,相较于最先进的半监督学习方法,我们的方法始终具有更好的性能。