Jun, 2012

别再纠结学习率了

TL;DR本文提出了一种自动调整多个学习率的方法,以使期望误差最小化,该方法依赖于样本之间的局部梯度变化,并在凸学习任务和非凸学习任务中证明了该算法具有与 SGD 或其他自适应方法相同的性能。