关键词stochastic quasi-newton
搜索结果 - 3
- 训练深度神经网络的实用拟牛顿方法
本文提出了一种使用 Kronecker 乘积近似 Hessian 矩阵和结构化梯度的 Kronecker 分块对角线 BFGS 和 L-BFGS 方法用于深度神经网络训练,通过测试验证其性能优于或与 KFAC 和一阶随机方法相当。
- adaQN: 一种适应性拟牛顿算法用于训练循环神经网络
本篇论文提出了一种名为 adaQN 的随机拟牛顿算法,用于解决循环神经网络 (RNN) 训练中的梯度消失 / 爆炸问题,该方法使用了一种新的 L-BFGS 缩放初始化方案,并且在存储和保留 L-BFGS 曲率对方面非常明智,实践表明 ada - 一种方差减少的随机牛顿法
该研究提出了一种名为 “Vite” 的基于 Stochastic Quasi-Newton 算法的优化方法,它利用一种现有的一阶技术来减少噪声和方差,并在大规模学习问题上取得了不错的结果。