Jun, 2023
DropCompute:通过计算方差减少计算量的简单而稳健的分布式同步训练
DropCompute: simple and more robust distributed synchronous training via compute variance reduction
Niv Giladi, Shahar Gottlieb, Moran Shkolnik, Asaf Karnieli, Ron Banner...
TL;DR本文提出了一种简单而有效的分散式方法,以减少工作人员之间的变化,从而提高同步训练的鲁棒性,并验证了这些结果。