Jul, 2023

通过选择性同步加速分布式机器学习训练

TL;DR本文提出了一种名为 SelSync 的低开销方法,用于 DNN 训练,该方法具有动态选择通信与否的功能,可提高收敛性,比 BSP 技术减少训练时间高达 14 倍。