Mar, 2013

神经网络的黎曼度量 I:前馈网络

TL;DR本文介绍了四种用于神经网络训练的算法,它们分别适用于不同的可扩展性限制。这些算法基于微分几何的理论,并基于自然梯度使用 Fisher 信息矩阵,或基于 Hessian 方法并缩小尺度以实现可扩展性,同时保持它们的一些关键数学性质。