Oct, 2018

通过临近算子进行量化神经网络的 ProxQuant

TL;DR通过发现直通渐变法与 Nesterov 双平均算法相同,提出了一种更加合理的替代方法 ProxQuant,将基于量化网络的训练问题转化为规则化学习问题,并通过 Prox - 梯度方法进行优化。对于二元量化,ProxQuant 在稳定性上优于直通渐变法,并提供了一种强有力的替代方法。在将 ResNets 和 LSTMs 量化为二元和多位之后,ProxQuant 能在二元量化上实现优于现有水平的结果,并且在多位量化上与现有技术持平。