Jun, 2024

分布式学习中的平坦性与优化之间的权衡

TL;DR该论文提出了一个理论框架,用于评估和比较梯度下降算法在非凸环境中围绕局部极小值的行为方面的分布学习性能。它发现分散学习策略能够更快地逃离局部极小值并更有利地收敛到更平坦的极小值,从而提高了分类准确性。