Feb, 2019

深度网络极小值的尺度不变平坦度量

TL;DR通过提出基于海森矩阵的浅度测量,在深度网络训练中检验了大批量SGD最小值确实比小批量SGD最小值更锐利,并且我们证明了正同态激活的深度网络的等价关系在参数空间中的商流形结构,并提出了一种具有等价不变性的测量平坦度的方法。