Jul, 2024

知识蒸馏的不变一致性

TL;DR知识蒸馏技术中,我们引入了不变一致性蒸馏法(ICD),该方法结合了对比学习和明确的不变性惩罚,以确保学生模型的表示与教师一致,并在CIFAR-100数据集上证明其优于传统知识蒸馏技术和13种最先进方法,在一些情况下,学生模型的准确性甚至超过教师模型。