Sep, 2022

ViT 特征知识蒸馏的实用指南

TL;DR本文研究 Vision Transformer 的特征蒸馏方法,并提出 ViTKD 可以使基于 ImageNet 数据集的学生模型的准确率分别提升 1.64%、1.4%和 1.7%。