Feb, 2020
无悔学习中的最后迭代收敛:凸凹景观的约束极小极大优化
Last iterate convergence in no-regret learning: constrained min-max optimization for convex-concave landscapes
Qi Lei, Sai Ganesh Nagarajan, Ioannis Panageas, Xiao Wang
TL;DR本文研究了凸凹零和博弈问题,并提出了一种遵循在线学习框架的近似算法 Optimistic Multiplicative-Weights Update,在本地范围内表现出最后收敛性。