Sep, 2023

内存高效的混合精度优化器

TL;DR传统优化方法依赖于使用单精度浮点算术,在内存大小和计算性能方面具有成本。然而,混合精度优化技术利用单精度和半精度浮点算术来降低内存需求,同时保持模型准确性。我们在训练模型期间提供了一种算法,通过摆脱参数的浮点副本,实际上只保留半精度数,进一步减少内存使用。我们还通过在反向传播期间执行优化器步骤来探索去除梯度值的好处。在实践中,我们实现了高达 25% 的峰值内存使用降低和 15% 的更快训练速度,同时保持相同水平的准确性。