Jul, 2020

论本地更新方法中学习率的超大重要性

TL;DR研究一种算法家族——局部更新方法,证明其对于二次目标表现出随机梯度下降,设计了新的收敛速度来平衡模拟损失函数的条件数与真实损失函数之间的差距,并在实验中展示了适当的学习率调整对于达到最优行为的重要性以及自适应学习率衰减的实用方法.