BriefGPT.xyz
Ask
alpha
关键词
mixup based on stable diffusion
搜索结果 - 1
关于大型预训练模型的任务特定蒸馏的优良实践
大型预训练视觉模型在多样的识别任务上表现出显著的泛化能力。然而,现实世界中的应用通常需要针对特定问题的紧凑模型。本文针对这一目的,提出了各种知识蒸馏的变体,使得特定任务的紧凑模型(学生)能够从通用的大型预训练模型(教师)中学习。我们展示了近
→
PDF
5 months ago
Prev
Next