Feb, 2024

教师到学生知识迁移的嵌入式压缩

TL;DR使用可压缩的嵌入模块来改进知识蒸馏方法,以提高分类性能并增强学生模型的泛化能力。