ICLRDec, 2014

高维度景观探索

TL;DR本文旨在证明高维度空间中定义的某些非凸函数有一个只包含其临界点大部分的数值狭窄区间的存在,并通过对 MNIST 数据集中的师生网络的实验观察得出了类似的结论,并发现梯度下降和随机梯度下降方法可以在相同步数内达到此水平。