Feb, 2020

无悔学习中的最后迭代收敛:凸凹景观的约束极小极大优化

TL;DR本文研究了凸凹零和博弈问题,并提出了一种遵循在线学习框架的近似算法 Optimistic Multiplicative-Weights Update,在本地范围内表现出最后收敛性。