BriefGPT.xyz
Ask
alpha
关键词
large step size
搜索结果 - 1
ICML
大学习率下梯度下降的特殊属性
证明大步长是神经网络进行随机梯度下降 SGD 训练所必需的,并且可以帮助实现全局最小值。
PDF
2 years ago
Prev
Next