BriefGPT.xyz
Jan, 2019
利用海森矩阵特征值密度研究神经网络优化
An Investigation into Neural Net Optimization via Hessian Eigenvalue Density
HTML
PDF
Behrooz Ghorbani, Shankar Krishnan, Ying Xiao
TL;DR
研究优化过程中深度神经网络中Hessian谱的演化对动力学的影响,发现对于非批归一化网络,谱中的大量孤立特征值以及聚集在相应特征空间中的梯度的快速出现将影响优化速度,而批归一化网络中这两种效应几乎不存在。
Abstract
To understand the dynamics of
optimization
in
deep neural networks
, we develop a tool to study the evolution of the entire
hessian spectrum
→