Dec, 2014

FitNets: 纤细深度神经网络的提示

TL;DR本文提出了一种基于知识蒸馏的深度神经网络训练方法,通过使用教师网络的中间表示学习,允许训练比教师更深而且更窄的学生网络,并引入了额外参数来进行深浅网络之间的映射,以实现降低参数以提高运行速度或提升性能的目的。在 CIFAR-10 数据集上的实验表明,这种方法能够在参数规模几乎是教师网络的十分之一的条件下,取得比教师网络更好的性能。