Jun, 2017

超参数神经网络海森矩阵的实证分析

TL;DR我们研究了常见损失曲面的性质,并针对深度学习,通过Hessian矩阵的谱将其分为两个部分,并证明了Sagun等人所述的猜想。我们的观察结果对高维度的非凸优化具有重要意义,并提出了新的基于超参数冗余的几何角度视角。