BriefGPT.xyz
Ask
alpha
关键词
nonsmooth neural networks
搜索结果 - 3
去中心化随机次梯度法用于非光滑非凸优化
我们集中研究具有非凸非光滑目标函数的分布式优化问题,特别是非光滑神经网络的分布式训练。我们引入一个统一框架,名为 DSM,用于分析分布式随机次梯度方法的全局收敛性。我们证明了在温和条件下,我们提出的框架的全局收敛性,通过建立生成的序列渐近逼
→
PDF
4 months ago
深度学习中的分离权重衰减的 Adam 系列方法
本研究探讨了一类广泛的 Adam 系列方法在最小化二次正则化非光滑非凸优化问题中的收敛性质,特别是在训练带有权重衰减的非光滑神经网络的情况下。通过引入修正权重衰减的 AdamW 方法,我们提出了一种新颖的具有分离权重衰减的 Adam 系列方
→
PDF
9 months ago
具收敛性保证的非光滑优化的 Adam 家族方法
研究了 Adam 族方法在非光滑优化尤其是在训练非光滑神经网络方面的收敛性,提出了一个采用双时间尺度更新方案的新颖框架并证明了其在温和假设下的收敛性,介绍了一些植入了梯度剪切技术的随机次梯度方法并通过实验证明其高效性和健壮性。
PDF
a year ago
Prev
Next