Dec, 2024

知识蒸馏中的所有需求都是一个量身定制的坐标系统

TL;DR本研究解决了现有知识蒸馏方法依赖于特定任务大量教师模型的灵活性和效率问题。我们提出了量身定制坐标系统(TCS)方法,利用自监督学习预训练模型作为教师,只需进行一次前向传递即可捕获其暗知识。实验结果表明,TCS在知识蒸馏和少样本学习中显著提高了准确度,同时训练时间和GPU内存成本减少约一半。