We present a dynamical system framework for understanding Nesterov's
accelerated gradient method. In contrast to earlier work, our derivation does
not rely on a vanishing step size argument. We show that Nesterov acceleration
arises from discretizing an ordinary differential equation w
通过离散化对应于 Nesterov 加速梯度方法和 Polyak 重球方法的常微分方程进行研究,我们考虑了三种离散化方案:显式欧拉方案,隐式欧拉方案和辛方案。我们表明,将辛方案应用于 Shi 等人提出的高分辨率 ODE 可以实现加速率,用于最小化平滑的强凸函数。另一方面,当方案是隐式的,ODE 是低分辨率的,或者方案是显式的时,得到的算法要么无法实现加速,要么是不实用的。