May, 2023

GraVAC:通信高效的分布式深度学习训练自适应压缩

TL;DR本文介绍了 GraVAC,一种动态调整压缩因子的框架,用于在分布式数据并行训练中降低通信开销并提高训练速度。GraVAC 可以根据模型进展和梯度信息损失自适应地进行压缩,相较于静态压缩因子,可以将 ResNet101,VGG16 和 LSTM 的端到端训练时间分别缩短 4.32x,1.95x 和 6.67x,相较于其他自适应方案,整体加速比可达 1.94x 至 5.63x。