ICLRApr, 2021

优化器融合:更优秀的局部性和并行性的高效训练

TL;DR本文提出将优化器与前向或后向计算融合,重新排序前向计算、梯度计算和参数更新,旨在更好地利用局部性和并行性,从而提高迭代优化器的效率。实验结果显示,这种方法可以在不改变优化器算法的情况下,实现多种配置的 20% 训练时间缩短。