Nov, 2024

使用部分信息分解量化知识蒸馏

TL;DR本研究解决了知识蒸馏过程中信息转移的理论极限问题。通过引入部分信息分解的方法,量化了教师模型表示中可蒸馏与已蒸馏知识的量,并证明该指标可以有效应用于蒸馏过程中,缓解教师与学生模型表示之间的复杂性差距。这为资源受限环境下机器学习模型的部署提供了新的视角和解决方案。