May, 2023

知识扩散用于蒸馏

TL;DR本论文提出了一种名为 DiffKD 的新型知识蒸馏方法,其基于扩散模型显式去噪和匹配特征,以更好地实现精简干净特征和教师特征的蒸馏。在图像分类、对象检测和语义分割任务中,DiffKD 在各种特征类型上均取得了最先进的性能。