ICLRMay, 2023

NORM: 基于 N 对一表示匹配的知识蒸馏

TL;DR本研究提出了 N-to-One Representation Matching (NORM) 知识蒸馏方法,其主要利用由两个线性层组成的 Feature Transform (FT) 模块,可以在训练中保留教师网络学习到的信息,并且通过新颖的多对一表示匹配机制,推动学生网络逼近教师网络的表示。 在不引入额外参数或结构修改的情况下,在多个视觉识别基准测试中展示了该方法的领先性能。