BriefGPT.xyz
Ask
alpha
关键词
cumulative spatial knowledge distillation
搜索结果 - 1
ICCV
累积空间知识蒸馏用于视觉 Transformers
该研究提出了 Cumulative Spatial Knowledge Distillation (CSKD) 方法,它能够在不引入中间特征的情况下,从相应的 CNN 空间响应中将空间上的知识传递到 ViT 的所有补丁令牌,并在训练过程中利
→
PDF
a year ago
Prev
Next