May, 2023

深度神经网络训练的自适应梯度预测

TL;DR提出了一种名为 ADA-GP 的算法,通过使用梯度预测来加速深度神经网络(DNN)的训练,同时保持准确性,并且这种算法具有可适应的特性来平衡精度和性能,同时还提供了一种详细的硬件扩展来实现梯度预测加速潜力。通过对 14 种 DNN 模型的广泛实验表明,与基线模型相比,ADA-GP 可以实现 1.47 倍的平均加速,并且由于减少了与基线硬件加速器相比的外部内存访问,平均消耗的能量降低了 34%。