BriefGPT.xyz
Ask
alpha
关键词
blended coarse gradient descent
搜索结果 - 1
混合粗略梯度下降用于深度神经网络的全量化
提出了混合粗微分下降算法 (BCGD),该算法利用了人工升高方向的粗微分来进行系数的权重更新,从而在目标值上产生足够的下降,加速了量化训练效果,并在 ImageNet 分类任务中全量化 ResNet-18 网络汇报了 64.36%的 top
→
PDF
6 years ago
Prev
Next