May, 2024

SADDLe: 具有异构数据的尖锐感知去中心化深度学习

TL;DR本文提出 SADDLe,一种利用 Sharpness-Aware Minimization (SAM) 的锐度感知的分布式深度学习算法,以解决分布式训练中的局部过拟合、全局模型泛化不佳和高通信成本等实际挑战。实验结果表明,与现有技术相比,SADDLe 能使测试准确率提高 1-20%,且在 4 倍的通信压缩下,仅平均下降 1%。