Nov, 2020

自然梯度的痕迹限制克罗内克 - 分解近似

TL;DR本文提出了一种新的用于训练深度神经网络的二阶优化方法,叫做 TKFAC(Trace-restricted Kronecker-factored Approximate Curvature),其包括对 Fisher 信息矩阵的逼近和新的阻尼技术,在实验中表现优异。