CVPRMar, 2021

深度层级动态神经网络中的嵌入式知识蒸馏

TL;DR本研究提出了一种嵌入知识蒸馏机制的深度级联动态神经网络 (DDNN),通过 Kullback-Leibler 散度和自注意力蒸馏在在线知识蒸馏中获得多个高精度子网络,以提高子网络的泛化能力,从而在 CIFAR-10/100 和 ImageNet 数据集上实现了 better performance than individually training networks while preserving the original performance of full-nets。