BriefGPT.xyz
Ask
alpha
关键词
hessian methods
搜索结果 - 1
神经网络的黎曼度量 I:前馈网络
本文介绍了四种用于神经网络训练的算法,它们分别适用于不同的可扩展性限制。这些算法基于微分几何的理论,并基于自然梯度使用 Fisher 信息矩阵,或基于 Hessian 方法并缩小尺度以实现可扩展性,同时保持它们的一些关键数学性质。
PDF
11 years ago
Prev
Next