ECCVJul, 2024

AdaDistill:用于深度人脸识别的自适应知识蒸馏

TL;DR使用自适应知识蒸馏方法 AdaDistill 在深度人脸识别中,通过利用高性能教师模型的知识来提高紧凑学生模型的性能。AdaDistill 将知识蒸馏概念嵌入到带有蒸馏类中心的边际惩罚 softmax 损失中,通过在训练迭代中控制学生的学习能力进展来相对调整蒸馏的知识,无需调整任何超参数。大量实验证明了 AdaDistill 可以增强学生的判别学习能力,并在多个具有挑战性的基准测试中展示了对各种最先进竞争者的优越性。