Nov, 2023

个别类别信息传递的余弦相似度知识蒸馏

TL;DR通过使用批量预测的余弦相似度度量以及基于余弦相似度的温度调节方法,我们提出了一种新颖有效的知识蒸馏方法,可以使学生模型达到与教师模型相似甚至更好的性能,该方法将为模型压缩的未来研究提供宝贵的见解。