Oct, 2023

分布式深度学习的二次同步规则

TL;DR使用分布式深度学习和数据并行 ism 方法,通过提出基于理论的使用二次同步规则(QSR)来动态确定本地梯度方法中的一个超参数 H 的值,以提高泛化性能。在 ImageNet 上的实验结果表明,使用 QSR 能够持续改善测试准确性,并且相比标准数据并行训练,可以显著减少训练时间并提高验证准确性。