BriefGPT.xyz
Ask
alpha
关键词
education distillation
搜索结果 - 1
教育馏析:让学生模型在学校中学习
本文将动态增量学习引入到知识蒸馏中,提出了一种教育蒸馏的蒸馏策略,通过将学生模型从完整的学生模型分割为低级模型,结合设计的教学参考层,逐渐提升学生模型的年级,并从更多的教师模型中进行学习和蒸馏,使得学生模型的性能逐渐从低级到高级逐阶段提高。
→
PDF
7 months ago
Prev
Next