Jan, 2024

生成去噪蒸馏:简单随机噪声在密集预测中有效传递知识

TL;DR知识蒸馏是将知识从一种更强大的大模型(教师)转移到一个更简单的对应物(学生)的过程。通过引入新颖的发生器去噪蒸馏方法(GDD),本文提出了一种从教师中导出更紧凑表示的方法,并在目标检测、实例分割和语义分割等任务中得到了新的最佳表现。