Nov, 2021

面向深度神经网络的锐度感知量化

TL;DR本研究提出了一种新方法,叫做sharpness-aware quantization,旨在通过减小量化时的抖动来提高网络压缩的泛化性能,此方法在多组实验中均能取得比当前最先进方法更好的结果。