Jan, 2020

寻找更好的学生学习精炼知识

TL;DR本文提出使用L1范数优化从教师网络选取子图作为学生来自动搜索最优学生架构进行知识蒸馏,并在CIFAR数据集上验证,实验表明相比手动指定学生结构,学习得到的学生模型性能更好,并且对该学生模型进行可视化和理解。