CVPRMar, 2023

DisWOT: 无需训练的蒸馏学生架构搜索

TL;DR本文提出了一种名为 DisWOT 的新方法,使用进化算法,在没有进行训练的情况下,以教师神经网络的相似度为依据来搜索出最优的学生神经网络结构,并且在知识蒸馏阶段大幅提高了模型性能。实验结果表明,该方法在不同的搜索空间中均取得了最先进的成果。