BriefGPT.xyz
Jul, 2018
高瑞德区间:走向更好的神经网络损失函数景观理解
The Goldilocks zone: Towards better understanding of neural network loss landscapes
HTML
PDF
Stanislav Fort, Adam Scherlis
TL;DR
通过在低维度的超平面和超球面上评估代价函数的海森矩阵,我们发现全连接神经网络和卷积神经网络的代价函数在它们的空间参数半径较大的固定范围内,具有异常的凸性和正曲率,此处我们称之为“金发姑娘区间”,该效应与神经元网络的初始化方法,包括公共初始化技巧之间有着密切的关联。
Abstract
We explore the
loss landscape
of fully-connected
neural networks
using random, low-dimensional hyperplanes and hyperspheres. Evaluating the Hessian, $H$, of the loss function on these hypersurfaces, we observe 1)
→