Mar, 2024

频率注意力知识蒸馏

TL;DR使用频域中的注意机制,在图像分类中提出了一种增强的知识蒸馏模型,可以从复杂的教师模型中提取全局信息,并在各种教师和学生架构上实验证明本方法优于其他知识蒸馏方法。