Oct, 2018

模型压缩的失真率研究:从理论到实践

TL;DR本文研究深度神经网络模型压缩技术,提出了基于速率失真理论的压缩架构以及优化剪枝和量化技术,理论上证明了该架构对于一层 ReLU 神经网络最优,实验证明该方法在压缩 - 精度平衡上显著优于基线方法。