Jan, 2024
生成去噪蒸馏:简单随机噪声在密集预测中有效传递知识
Generative Denoise Distillation: Simple Stochastic Noises Induce Efficient Knowledge Transfer for Dense Prediction
Zhaoge Liu, Xiaohao Xu, Yunkang Cao, Weiming Shen
TL;DR知识蒸馏是将知识从一种更强大的大模型(教师)转移到一个更简单的对应物(学生)的过程。通过引入新颖的发生器去噪蒸馏方法(GDD),本文提出了一种从教师中导出更紧凑表示的方法,并在目标检测、实例分割和语义分割等任务中得到了新的最佳表现。