BriefGPT.xyz
大模型
Ask
alpha
关键词
bidirectional kd
搜索结果 - 1
ECCV
基于稠密交叉层互相蒸馏的知识转移
在这篇论文中,我们提出了一种改进的双向知识迁移方法 Dense Cross-layer Mutual-distillation (DCM),它采用了协作训练师生网络的方法,引入了辅助分类器和密集的双向知识蒸馏操作,在各种知识迁移任务中都表现
→
PDF
4 years ago
Prev
Next