BriefGPT.xyz
Ask
alpha
关键词
polyak-lojasiewicz inequality
搜索结果 - 4
正则化梯度剪裁能可靠地训练宽且深的神经网络
我们证明了基于正则化的梯度剪裁算法可以收敛于深度神经网络损失函数的全局最小值,只要网络具有足够的宽度,并且通过实证证明这一算法在深度学习中与现有的启发式方法相竞争,因此这一算法构成了一种新的严谨深度学习方法。
PDF
3 months ago
粒子梯度下降的误差界和对数 - 索伯列夫和塔拉格兰不等式的推广
非渐近误差界限
PDF
4 months ago
关于带有噪声的动量随机梯度下降法在机器学习中的收敛速率
本文研究了非凸优化中动量随机梯度下降 (MSGD) 算法的连续性版本,并证明了在目标函数满足 Lipschitz 连续性和 Polyak-Lojasiewicz 不等式的条件下,MSGD 算法的目标函数极限收敛指数级收敛,同时在给定摩擦参数
→
PDF
a year ago
一类非凸非凹极小极大问题的全局收敛与方差缩减优化
研究非凸极小问题的解决方案,提出两种算法 AGDA 和随机 AGDA,以及一种方差缩减算法,可以应用于类似生成对抗网络和对抗学习等新兴机器学习应用。
PDF
4 years ago
Prev
Next