Feb, 2024

多类别标签噪声下的自我蒸馏和部分标签学习的理解

TL;DR自蒸馏是使用教师模型的输出来训练学生模型的过程,本研究在多类别分类中从理论上探讨了自蒸馏,研究了多轮自蒸馏和使用精炼教师输出的自蒸馏,其灵感源于部分标签学习(PLL)。我们通过为学生模型的输出推导出一个封闭形式解,发现自蒸馏在具有高特征相关性的实例中起到标签平均化的作用。这种平均化有助于模型关注与给定实例相关的特征聚类以预测标签,但在蒸馏轮次增多时会导致性能衰减。此外,我们证明了自蒸馏在标签噪声情景中的有效性,并确定了达到100%分类准确率所需的标签污染条件和最小蒸馏轮次。我们的研究还揭示了在高噪声率条件下,一步精炼教师输出的蒸馏超过了使用教师直接输出的多步自蒸馏的效果。