Oct, 2022

基于图神经网络的在线跨层知识蒸馏与深度监督

TL;DR本文提出一种在线知识蒸馏框架 ——Alignahead++,它通过一种交替的训练过程,将学生模型的结构和特征信息转移给另一个同时训练的学生模型的前一层,同时在每个中间层添加辅助分类器以避免过度平滑问题。实验结果表明,在不需要预训练模型的监督情况下,通过增加学生数量,我们的协作训练框架可以稳定提高学生模型的性能。