ICMLJun, 2022
优化剪裁和幅值感知求导以提高量化感知训练
Optimal Clipping and Magnitude-aware Differentiation for Improved Quantization-aware Training
Charbel Sakr, Steve Dai, Rangharajan Venkatesan, Brian Zimmer, William J. Dally...
TL;DR本文提出了一种名为 OCTAV 的递归算法来确定 MSE 最优裁剪标量,基于这个算法,我们在每一步都能得到具有最小量化噪声的 QAT 算法。同时,我们提出了一种新的技术,即大小感知差分,以进一步提高精度,在多项任务中取得了最先进的精度。