ICLROct, 2017

混合精度训练

TL;DR介绍了一种使用半精度浮点数训练深度神经网络的技术,通过减少内存消耗和利用未来处理器的半精度硬件单元,大幅提高模型训练的计算速度。