Feb, 2019

加速重缩放梯度下降:平滑函数的快速优化

TL;DR本文提出了下降算法族,引入了一种名为坐标梯度算法的新的一阶算法,并证明了在函数强平滑的情况下,坐标梯度算法的收敛速度比梯度下降算法更快。当目标函数为凸函数时,我们提出了两种新颖的 “加速” 下降方法的框架,一种是 Nesterov 风格的,另一种是 Monteiro 和 Svaiter 风格的,都使用单个 Lyapunov 进行加速。在相同的强平滑性假设下,坐标梯度下降可以使用两个框架加速。我们提供了一些在机器学习领域中强平滑损失函数的实例和数值实验来验证我们的理论结果,另外还介绍了一些关于 Lyapunov 优化的扩展,包括导出最优通用张量方法以及将我们的框架扩展到坐标设置中。