AAAINov, 2019

利用神经架构搜索实现 Oracle 知识蒸馏

TL;DR提出了一种新的知识蒸馏框架,利用神经架构搜索技术和神经网络来学习深度神经网络教师模型以获得高效的学生模型。该方法通过减少教师和学生之间的模型容量差距,从而最大化从教师模型进行蒸馏的收益,我们在基于 CIFAR-100 和 TinyImageNet 的图像分类数据集上进行了广泛的实验,并通过神经架构搜索技术发现新的学生模型,其在准确性和内存使用上都比教师模型表现更好。