Aug, 2023
ABS-SGD:一种适用于异构GPU集群的带有自适应批大小的延迟同步随机梯度下降算法
ABS-SGD: A Delayed Synchronous Stochastic Gradient Descent Algorithm
with Adaptive Batch Size for Heterogeneous GPU Clusters
TL;DR我们提出了一种在异构GPU集群中具有自适应批大小的延迟同步随机梯度下降(ABS-SGD)算法,该算法通过全局同步来积累延迟的梯度,并使用积累的延迟梯度来更新参数,实现了计算资源的充分利用,并且在异构集群中具有收敛性。