Jun, 2024

稳定且存储有效的数据集蒸馏:匹配凸化轨迹

TL;DR通过对目标函数进行简单的转换和利用 MCT (Matching Convexified Trajectory)方法,研究论文发现 MTT 方法存在的三个主要问题:Stochastic Gradient Descent(SGD)生成的专家轨迹不稳定,提取过程的收敛速度慢以及专家轨迹的存储消耗高,并提出了一种能够快速且稳定地引导学生网络收敛的方法。实验结果显示,MCT 方法在三个公共数据集上相较于传统的 MTT 方法具有优越性。