ICMLMar, 2023

高效训练序列的知识蒸馏

TL;DR本篇研究探讨了如何通过知识蒸馏技术,减少重新训练模型所需时间和计算成本,实验结果表明,在保证准确率的前提下,通过蒸馏前一次迭代的模型来优化后续的模型,是一种可行的对模型训练耗时和费用成本的优化方法。