Feb, 2024

共同监督学习:通过分层专家混合改善从弱到强的泛化能力

TL;DR通过引入多个专业老师来共同监督强大的学生模型,我们的方法类似于经典的专家混合模型,通过逐步交替学生训练和教师分配,并引入教师-学生和局部-全局一致性,来解决具有大能力差距时的弱到强泛化挑战。