Apr, 2025

群体相对知识蒸馏:学习教师的关系性归纳偏置

TL;DR本研究针对现有知识蒸馏方法忽视教师模型相对预测中重要的关系性归纳偏置的问题,提出了群体相对知识蒸馏(GRKD)框架。GRKD通过关注类别之间的相对排名来提炼教师知识,实验表明该方法在需要细粒度分类的任务中相较于现有方法表现出更优的泛化能力,展示了利用教师知识的新视角。