BriefGPT.xyz
Ask
alpha
关键词
multi-model settings
搜索结果 - 1
CVPR
泛化问题的重要性:通过参数混合实现最小化损失平稳以实现高效在线知识蒸馏
本篇论文提出了一种在线知识蒸馏方法,采用多模型设置和参数混合的方式来提高学生的泛化性能,该方法可以达到更平坦的最小值并获得稳健的解决方案。
PDF
a year ago
Prev
Next