BriefGPT.xyz
Ask
alpha
关键词
stochastic second-order optimization
搜索结果 - 1
深度神经网络训练的精确 Gauss-Newton 优化
我们介绍了 EGN,一种随机二阶优化算法,将广义高斯 - 牛顿(GN)Hessian 近似与低秩线性代数相结合,计算下降方向。借助 Duncan-Guttman 矩阵恒等式,通过分解一个与小批次大小相同的矩阵来获得参数更新,这在维度远超批次
→
PDF
a month ago
Prev
Next