BriefGPT.xyz
Ask
alpha
关键词
optimisation trajectory
搜索结果 - 1
利用连续时间理解对角线线性网络训练中的动量
通过分析动量梯度下降的连续时间方法,我们研究了动量对优化轨迹的影响,并得到了唯一定义优化路径和提供简单加速规则的内在量 λ = γ / (1 - β)²。通过在超参数化回归环境中训练 2 层对角线线性网络,我们表征了隐式正则化问题中的恢复解
→
PDF
4 months ago
Prev
Next