Apr, 2024

使用合成数据进行零样本蒸馏的图像编码器:如何有效利用

TL;DR利用图像特征为基础的 L2 蒸馏损失,我们训练出的学生模型在四个特定领域数据集上实现了与在 DataCompXL 上训练的 ViT-B/32 教师模型相当的零样本性能,同时参数减少了高达 92%。