Nov, 2023

用于预训练小型基础模型的非对称遮蔽蒸馏

TL;DR通过非对称蒙版蒸馏 (AMD) 框架,以无监督学习为基础的相对较小视觉变换器模型能够高效适应下游任务,提高分类准确率和性能表现。