Jan, 2024

知识蒸馏中重新思考聚焦核对齐

TL;DR使用CKA(Centered Kernel Alignment)理论有效地将大规模模型和轻量级模型之间的表达差异解耦为MMD(Maximum Mean Discrepancy)的上界和一个常数项,提出了一种新颖的RCKA(Relation-Centered Kernel Alignment)框架,根据任务特征动态定制CKA的应用,以较低的计算源消耗获得相比前期方法相当的性能,在CIFAR-100、ImageNet-1k和MS-COCO上的广泛实验表明,该方法在几乎所有的师生网络对中对于图像分类和目标检测都达到了最先进的性能。