Mar, 2022

高效子结构知识蒸馏

TL;DR该文提出了一种简单有效的方法,通过局部匹配所有子结构的预测结果而非整个输出空间,将知识从教师模型传递给其学生模型,较之现有方法在训练效率方面相对更高,并鼓励学生模型更好地模拟教师模型的内部行为。该方法在两个结构化预测任务上的实验表明,可以胜过先前的方法并且减少一个训练周期的时间成本。