Mar, 2024

量化 DNN 时代的魔法

TL;DR本文提出了一种量化感知训练的方法,通过引入一种独立于小批量大小的新型规范化(Layer-Batch Normalization)和标准化权重的缩放环夹函数对权重进行量化,同时对激活函数使用同样的函数进行量化,并应用替代梯度来训练模型,实验证明我们的量化方法可以在最小的准确性降低下实现。