Nov, 2019

从搜索到精炼:珍珠遍布各处,却不见双眸

TL;DR该论文提出一种基于神经网络结构搜索的知识蒸馏模型AKD,可以将老师模型的知识蒸馏到学生模型的参数和结构中。实验表明AKD方法比传统的NAS和KD方法更有效,在ImageNet分类任务和其他任务中都能取得最先进的结果。