BriefGPT.xyz
Ask
alpha
关键词
dispersive noise assumptions
搜索结果 - 1
非凸随机梯度下降逃离鞍点的尖锐分析
本文将通过对随机梯度下降进行深入分析,证明当目标函数满足梯度 Lipschitz、Hessian-Lipschitz 和发散噪声假设时,SGD 能够在 O(ε^ -3.5)次随机梯度计算中逃离鞍点并找到(ε,O(ε^ 0.5))- 近似二阶
→
PDF
5 years ago
Prev
Next