Jul, 2024

AMD:大规模视觉模型的自动多步蒸馏

TL;DR我们提出了一种名为AMD的新方法,用于大规模视觉模型压缩,通过跨多个步骤展开蒸馏过程,形成中间的助教模型,以进一步蒸馏到学生模型。我们的方法在多个图像分类数据集上表现优于已有方法,为大规模视觉模型的知识蒸馏方法铺平了道路。