Jun, 2018
多分支结构的深度神经网络更少非凸性
Deep Neural Networks with Multi-Branch Architectures Are Less Non-Convex
Hongyang Zhang, Junru Shao, Ruslan Salakhutdinov
TL;DR我们研究了类似 ResNeXt、Inception、Xception、SqueezeNet 和 Wide ResNet 的多路神经网络结构,并发现这些架构的成功原因之一在于它们较少具有内在非凸性,我们提供了两类网络结构对其对偶间隙的量化保证,表明在这些网络的分支数量增加时,对偶间隙会缩小到零,而这个结果使我们更好地理解了过度参数化的能力和减少非凸问题表面的重要意义。