Mar, 2018

高准确性低精度训练

TL;DR本文介绍了一种名为 HALP 的低精度随机梯度下降变体,通过使用 SVRG 和位中心技术来降低梯度方差和量化误差,将低精度计算应用于深度学习任务,并且实验验证表明 HALP 能够匹配全精度 SVRG 的收敛轨迹,性能优于通常的低精度 SGD。