Jan, 2019

深度神经网络 Hessian 谱中离群点的三层分层结构测量

TL;DR通过对参数与模型 logits 导数结构的研究,我们发现了导致 Hessian 特异值异常的二阶矩矩阵结构,该结构可以通过平均操作来近似 Hessian 的主子空间,避免高维特征值分析的需求。