Apr, 2024

使用合成数据进行零样本蒸馏的图像编码器:如何有效利用

TL;DR利用图像特征为基础的L2蒸馏损失,我们训练出的学生模型在四个特定领域数据集上实现了与在DataCompXL上训练的ViT-B/32教师模型相当的零样本性能,同时参数减少了高达92%。