Apr, 2024

动态温度知识蒸馏

TL;DR介绍了一种动态温度知识蒸馏(DTKD)方法,通过量化模型输出分布的平滑度来为教师和学生模型分别确定样本特定的温度,从而在知识传递过程中提高性能。在CIFAR-100和ImageNet-2012上的实验证明,DTKD在目标类和非目标类知识蒸馏方案中表现出较高的鲁棒性。