Oct, 2023

神经网络可行的无鞍牛顿优化的 Hessian-Vector 乘积系列

TL;DR提出了一个既能解决大规模的 Hessian 矩阵问题,又能优化非凸性的优化算法,采用了一个无限级数截断的方法,并在多种情境下进行了验证,包括在 CIFAR-10 上训练的 ResNet-18 模型。