Aug, 2018
混合粗略梯度下降用于深度神经网络的全量化
Blended Coarse Gradient Descent for Full Quantization of Deep Neural Networks
Penghang Yin, Shuai Zhang, Jiancheng Lyu, Stanley Osher, Yingyong Qi...
TL;DR提出了混合粗微分下降算法 (BCGD),该算法利用了人工升高方向的粗微分来进行系数的权重更新,从而在目标值上产生足够的下降,加速了量化训练效果,并在 ImageNet 分类任务中全量化 ResNet-18 网络汇报了 64.36%的 top-1 准确率。