BriefGPT.xyz
Ask
alpha
关键词
stepsizes
搜索结果 - 2
自适应梯度下降(无需下降)
本文提供一个简明的证明,只需遵循两个规则即可自动化梯度下降:1)不要过快增加步长,2)不要超出局部曲率;通过遵循这些规则,可以得到对局部几何条件自适应的方法,收敛保证只取决于解的附近的平滑度,因此收敛于任何凸问题中,包括可以最小化任意连续两
→
PDF
5 years ago
神经网络的对角缩放
定义了一种二阶神经网络随机梯度训练算法,其块对角结构有效地实现了单元激活的归一化,并研究了该算法在稳健性方面的不足之处,揭示了步长缩放的新方式以及处理成本曲率快速变化的重要性。
PDF
7 years ago
Prev
Next