Jan, 2024

知识蒸馏中重新思考聚焦核对齐

TL;DR使用 CKA(Centered Kernel Alignment)理论有效地将大规模模型和轻量级模型之间的表达差异解耦为 MMD(Maximum Mean Discrepancy)的上界和一个常数项,提出了一种新颖的 RCKA(Relation-Centered Kernel Alignment)框架,根据任务特征动态定制 CKA 的应用,以较低的计算源消耗获得相比前期方法相当的性能,在 CIFAR-100、ImageNet-1k 和 MS-COCO 上的广泛实验表明,该方法在几乎所有的师生网络对中对于图像分类和目标检测都达到了最先进的性能。