Oct, 2024

基于相关匹配的高效鲁棒知识蒸馏方法

TL;DR本文旨在解决知识蒸馏中学生模型性能提升的边际收益递减问题,提出了一种新的相关匹配知识蒸馏方法(CMKD),该方法不仅使学生模型获得教师模型的概率值,还学习类之间的相对排名。实验表明,CMKD可以在CIFAR-100和ImageNet上持续实现最先进的性能,并能很好地适应多种教师架构及其他知识蒸馏方法。