BriefGPT.xyz
Ask
alpha
关键词
asymmetric masked distillation
搜索结果 - 1
用于预训练小型基础模型的非对称遮蔽蒸馏
通过非对称蒙版蒸馏 (AMD) 框架,以无监督学习为基础的相对较小视觉变换器模型能够高效适应下游任务,提高分类准确率和性能表现。
PDF
8 months ago
Prev
Next