BriefGPT.xyz
Ask
alpha
关键词
adaptive stochastic gradient descent
搜索结果 - 1
ICLR
自适应 Polyak 重球方法中动量参数在最优收敛中的作用
本文旨在解决现实应用中使用随机梯度下降法进行深度学习和凸优化时,普遍使用最后一次迭代作为最终解决方案,但唯独它的可用遗憾分析和恒定动量参数设置只保证平均解的最佳收敛问题,并且探究单独收敛分析问题,最终我们证明了:在约束凸问题中,使用 Pol
→
PDF
3 years ago
Prev
Next