BriefGPT.xyz
May, 2014
非凸优化中的鞍点问题
On the saddle point problem for non-convex optimization
HTML
PDF
Razvan Pascanu, Yann N. Dauphin, Surya Ganguli, Yoshua Bengio
TL;DR
该研究论文旨在提出一种新的算法-无鞍牛顿法,通过对梯度下降和拟牛顿方法的比较,研究表明高维空间中的鞍点可能是局部最小值的主要原因,而不是通常认为的局部最小值过多。该算法能够快速避免高维鞍点,特别是在深度神经网络的训练中具有优势。
Abstract
A central challenge to many fields of science and engineering involves minimizing
non-convex error functions
over continuous, high dimensional spaces.
gradient descent
or quasi-Newton methods are almost ubiquitou
→