ICMLJun, 2022

重新审视面向架构的知识蒸馏:更小的模型和更快的搜索

TL;DR介绍一种名为 TRADE 的新算法,利用 Trust Region Aware architecture search 快速寻找有效的学生网络结构,并使用 Bayesian optimization 方法优化。实验结果表明,TRADE 算法在知识蒸馏下产生的学生网络结构在性能上显着优于常规 NAS 方法和预定义体系结构。