Nov, 2022

最小化累积轨迹误差以提高数据集蒸馏

TL;DR本文提出了一种基于优化算法的Flat Trajectory Distillation(FTD)方法来缓解 distortion 和 subsequent evaluation 之间的累积轨迹误差,实验证明该方法可提高梯度匹配方法的性能,并适用于神经架构搜索。