BriefGPT.xyz
Ask
alpha
关键词
tf-kd
搜索结果 - 1
CVPR
通过标签平滑正则化重新审视知识蒸馏
本文挑战了使用强大的 teacher model 教授弱 student model 的共识,详细阐述了 KD 和 label smoothing regularization 之间的关系,提出了 Teacher-free Knowledg
→
PDF
5 years ago
Prev
Next