Nov, 2015

超参数神经网络中初始流域的质量

TL;DR本文探讨了在 ReLU 神经网络中,通过随机初始化的方式初始参数,研究与之相关的非凸优化函数的几何结构,寻找全局最小点和小的最小目标价值。结果表明,相较于小型神经网络,大型神经网络更容易满足这些性质。