Mar, 2024

使用部分海森矩阵的 SGD 优化深度神经网络

TL;DR基于二阶算法和Hessian矩阵的优化器SGD-PH在深度神经网络训练中取得了良好的性能。