ICMLMay, 2023

大卷积核是否比 Transformer 更适合为 ConvNets 提供指导?

TL;DR研究表明,现代大核卷积神经网络对于小核卷积神经网络的教学更加有效,从而更适合于知识蒸馏。在使用大到小核蒸馏的过程中,大卷积神经网络的良好特性,例如更大的有效接收域,可以顺利地传递到学生身上,并且在 ImageNet 上实现了 83.1% 的 top-1 准确度,超过了当前的 SOTA 方法,包括 ConvNeXt V2 和 Swin V2