Nov, 2019

知识表示:用于知识蒸馏的高效、稀疏的先验知识表示

TL;DR本文提出了一种以先验知识为主要建模对象的知识表示框架,并设计了一种稀疏重编码惩罚,以约束学生网络的学习,从而在知识蒸馏过程中避免过度正则化和更快地收敛。实验表明,该框架即使目标网络的表示能力不如期望,仍然实现了最先进的性能表现,并且灵活易于与基于后验知识的其他知识蒸馏方法结合使用。