深度不会导致糟糕的局部极小值

Feb, 2017

Depth Creates No Bad Local Minima

Haihao Lu, Kenji Kawaguchi

TL;DR本文研究深度学习中通过证明只有深度，没有非线性性质也不会产生坏局部极小值，由此大大简化了之前证明前馈深度线性神经网络所有局部极小值也是全局极小值的方法，并推广到了深度线性模型的平方误差函数以外的情形。

Abstract

In deep learning, \textit{depth}, as well as \textit{nonlinearity}, create non-convex loss surfaces. Then, does depth alone create bad local mini