Dec, 2018
神经网络宽度对性能的好处:不良盆地的消失
On the Benefit of Width for Neural Networks: Disappearance of Bad Basins
Dawei Li, Tian Ding, Ruoyu Sun
TL;DR本文证明了从窄网络到宽网络的过渡存在一个相变,窄网络存在次优盆地(sub-optimal basins),而宽网络不存在。具体地,采用连续激活函数的一类宽网络损失曲面没有亚优盆地,但是对于宽度低于阈值的大类网络,存在不是全局最小值而是严格局部最小值的情况。