Nov, 2024

通过块级对数蒸馏解耦黑知识以实现特征层次对齐

TL;DR本研究针对知识蒸馏中教师网络与学生网络之间的差距,提出了一种新的块级对数蒸馏框架。该框架通过逐步替换教师的网络块,实现了对特征的隐式对齐,显示出对数与特征结合的巨大潜力,并使得最终结果与现有状态最先进的蒸馏方法相比更具竞争力。