Nov, 2023
个别类别信息传递的余弦相似度知识蒸馏
Cosine Similarity Knowledge Distillation for Individual Class Information Transfer
Gyeongdo Ham, Seonghak Kim, Suin Lee, Jae-Hyeok Lee, Daeshik Kim
TL;DR通过使用批量预测的余弦相似度度量以及基于余弦相似度的温度调节方法,我们提出了一种新颖有效的知识蒸馏方法,可以使学生模型达到与教师模型相似甚至更好的性能,该方法将为模型压缩的未来研究提供宝贵的见解。