Nov, 2023

教育馏析:让学生模型在学校中学习

TL;DR本文将动态增量学习引入到知识蒸馏中,提出了一种教育蒸馏的蒸馏策略,通过将学生模型从完整的学生模型分割为低级模型,结合设计的教学参考层,逐渐提升学生模型的年级,并从更多的教师模型中进行学习和蒸馏,使得学生模型的性能逐渐从低级到高级逐阶段提高。教育蒸馏策略结合蒸馏算法在公共数据集 CIFAR100、Caltech256 和 Food-101 数据集上比单一蒸馏算法取得了更优的结果。