BriefGPT.xyz
Ask
alpha
关键词
mirror descent technique
搜索结果 - 1
KDD
跟随自己的道路:一种渐进式的知识蒸馏方法
本文提出了一种名为 ProKT 的知识蒸馏方法,通过将教师模型的监督信号投影到学生参数空间中,从而在优化过程中实现了更好的局部最优解,实验结果表明,与其他现有的知识蒸馏方法相比,ProKT 在图像和文本数据集上都展现出了卓越的性能。
PDF
3 years ago
Prev
Next