ICMLJan, 2019

基于信息论的模型压缩对群体风险改进的理解

TL;DR通过压缩模型,平衡泛化误差的减小和经验风险的增加,从而证明模型压缩可以提高预训练模型的总体风险,同时推荐使用 Hessian-weighted K-means 聚类压缩方法进行正则化,通过神经网络的实验进一步验证了理论结论。