ICLRMar, 2020

数据并行和稀疏性对神经网络训练的影响理解

TL;DR该论文研究了神经网络训练中的数据并行和稀疏性等因素及其对训练的影响,发现批次大小与训练次数之间存在一种普遍的缩放趋势,并通过理论分析阐明了这种现象,为神经网络训练提供了更好的解释。