ECCVAug, 2020

匹配引导蒸馏

TL;DR本文提出了匹配引导蒸馏(Matching Guided Distillation,MGD)方法,该方法是一种高效的,不需要参数的方法,旨在解决适配模块带来的问题和随机初始化或特殊转换对预训练学生进行提炼的不利影响。MGD 的关键思想是将教师信道与学生信道的匹配作为分配问题,通过三种解决方案将教师信道的数量减少到学生信道,并使用部分蒸馏损失来更新分配。整个训练采用两个优化目标之间的协调下降方法。