Dec, 2019

PyHessian:基于 Hessian 的神经网络

TL;DR我们提出了 PYHESSIAN 框架,它可以快速计算深度神经网络的 Hessian 信息,支持分布式计算,并且可以用于分析神经网络模型,特别是损失函数曲率(即损失函数的拓扑),以便更好的理解不同模型和优化器的行为表现。通过对残差连接和 BN 层的分析,我们发现传统的方法不一定正确,BN 层不一定会使得损失函数曲率更加平滑,特别是在较浅的神经网络中。