Jan, 2023

在标签噪声存在的情况下理解自蒸馏

TL;DR研究了在带有噪声标签的监督学习问题中,使用SD的效果,并在理论上和经验上表明,最优的SD参数在某些情况下大于1,证明SD比优化有用,并在二元分类和随机标签损坏的情况下证明了学生比教师有更好的准确性。