可预测序列的优化、学习和游戏

Nov, 2013

Optimization, Learning, and Games with Predictable Sequences

Alexander Rakhlin, Karthik Sridharan

TL;DR提供了乐观镜面下降算法的几个应用：将其用于线下优化中的镜像近端算法、扩展到 Holder 平滑函数、并将结果应用于鞍点问题；将其用于有限零和矩阵博弈中，为两个强耦合玩家提供最小化最大值均衡的渐进速率 O((log T)/T)；再考虑问题的部分信息版本并将结果应用于凸规划，展示了近似最大流问题的简单算法。

Abstract

We provide several applications of optimistic mirror descent, an online learning algorithm based on the idea of predictable sequences. First, we recover the mirror prox algorithm for offline optimization, prove a