BriefGPT.xyz
Ask
alpha
关键词
l-bfgs
搜索结果 - 4
用于不平衡线性分类的扩展非对称 S 型神经元(SIGTRON)
本文介绍了一种名为 SIGTRON 的新的多项式参数化 Sigmoid 函数,并提出了其伴随的凸模型 SIC 模型,该模型使用了一种虚拟的 SIGTRON 诱导的凸损失函数。与传统的加权成本敏感学习模型不同,SIC 模型在损失函数上没有外部
→
PDF
6 months ago
训练深度神经网络的实用拟牛顿方法
本文提出了一种使用 Kronecker 乘积近似 Hessian 矩阵和结构化梯度的 Kronecker 分块对角线 BFGS 和 L-BFGS 方法用于深度神经网络训练,通过测试验证其性能优于或与 KFAC 和一阶随机方法相当。
PDF
4 years ago
ICML
机器学习的渐进批处理 L-BFGS 方法
本文介绍了一种结合渐进批处理、随机线搜索和稳定拟牛顿更新的新型 L-BFGS 算法,并提供了该方法在训练逻辑回归和深度神经网络时的收敛理论依据。
PDF
6 years ago
adaQN: 一种适应性拟牛顿算法用于训练循环神经网络
本篇论文提出了一种名为 adaQN 的随机拟牛顿算法,用于解决循环神经网络 (RNN) 训练中的梯度消失 / 爆炸问题,该方法使用了一种新的 L-BFGS 缩放初始化方案,并且在存储和保留 L-BFGS 曲率对方面非常明智,实践表明 ada
→
PDF
9 years ago
Prev
Next