Aug, 2018

混合粗略梯度下降用于深度神经网络的全量化

TL;DR提出了混合粗微分下降算法 (BCGD),该算法利用了人工升高方向的粗微分来进行系数的权重更新,从而在目标值上产生足够的下降,加速了量化训练效果,并在 ImageNet 分类任务中全量化 ResNet-18 网络汇报了 64.36%的 top-1 准确率。