ICMLJun, 2024

应用于强化学习的可扩展 Hessian 对角近似的再审视

TL;DR本研究探讨了利用近似方法计算 Hessian 对角线的成本,提出了一种以较小的额外计算量为代价的改进方案 HesScale,并应用于强化学习问题中的二阶优化和步长参数缩放,实验证明 HesScale 方法比现有方法优化更快,通过步长缩放提高了稳定性,这对于将二阶方法扩展到更大模型具有很大的潜力。