Jun, 2020

浅层 ReLU 神经网络的过度参数化对优化空间的影响

TL;DR本文研究了 ReLU 神经网络中的过度参数化对优化景观的影响,证明了当教师和学生网络拥有相同数量的神经元时,目标函数在全局最小值周围具有强凸性,但在任何超参数化量之后甚至没有局部凸性,而对于大多数方向来说保持一点强凸性,并在此属性之下展示优化保证。