BriefGPT.xyz
Ask
alpha
关键词
multi-model strategy
搜索结果 - 1
M2KD: 多模型、多层次知识蒸馏用于增量学习
本文提出一种多模型和多级别知识蒸馏策略,通过直接利用之前的模型快照和辅助蒸馏等方式,在保留旧类知识的同时提升整体性能,有效解决了旧类性能下降的问题。
PDF
5 years ago
Prev
Next