Apr, 2019

M2KD: 多模型、多层次知识蒸馏用于增量学习

TL;DR本文提出一种多模型和多级别知识蒸馏策略,通过直接利用之前的模型快照和辅助蒸馏等方式,在保留旧类知识的同时提升整体性能,有效解决了旧类性能下降的问题。