Feb, 2024

Preconditioned Langevin 动态预期损失揭示 Hessian Rank

TL;DR预处理 Langevin 动力学在目标函数的稳态点附近的期望损失与目标函数的 Hessian 排名成正比,并在神经网络中的应用中比较了类似 SGD 和类似 Adam 的预处理器的期望损失。