May, 2022

知识蒸馏的映射仿真

TL;DR通过新的几何视角将 source-blind knowledge distillation 问题视为老师和学生生成的分布对齐,提出 MEKD 结构通过生成对抗训练来模拟反向映射,并使用普适函数逼近和最优质量传输理论的理论保证,该方法在各种基准测试中优于现有的 source-blind KD 方法。