Mar, 2024

使用部分海森矩阵的 SGD 优化深度神经网络

TL;DR基于二阶算法和 Hessian 矩阵的优化器 SGD-PH 在深度神经网络训练中取得了良好的性能。