Jun, 2023

利用方差迁移和学习速率自适应增量式生长神经网络加速训练

TL;DR通过考虑参数化和优化策略对训练动态的影响,我们开发了一种高效增长神经网络的方法,该方法动态稳定权重、激活和梯度缩放,提出一种学习率适应机制来解决不平衡训练问题,并取得了与训练大型固定模型相当或更好的准确性和训练速度加快。