Jan, 2022

从稀疏到密集:一个学生知道的所有专家都知道

TL;DR本研究提出了一种基于密集的学生模型的知识集成方法,通过知识收集和知识蒸馏以获取关键知识并消除噪声,相对于传统的稀疏模型具有更高的精度和硬件友好性。