May, 2024

邻近领导去中心化随机梯度下降

TL;DR提出一种名为AL-DSGD的邻近领导者分散梯度下降方法,通过分配权重和动态通信图,在分散式深度学习优化中加快收敛速度、降低通信开销,改善了最先进技术的测试性能。