CVPRApr, 2020

扩展 Kronecker 分解近似曲率的续学习

TL;DR提出了一种二次罚函数方法用于神经网络的不断学习,其中包含批量归一化层。通过考虑实例间的关系,扩展了 K-FAC 方法,以便在实际情况下正确逼近深度神经网络的 Hessian 矩阵。同时提出了一种权重合并和再参数化方法,并且对批归一化的统计参数进行了适当处理。实验结果表明,该方法在各项指标上均优于基准算法。