BriefGPT.xyz
大模型
Ask
alpha
关键词
learnable kd layer
搜索结果 - 1
让学生决策的知识蒸馏层
通过引入可学习的 KD 层和模板学习方法,我们提出一种新的知识蒸馏技术,实现了对学生模型在中间层中进行特征变换的显式控制,并在多个分类基准测试中验证了其有效性。
PDF
10 months ago
Prev
Next