Feb, 2018

诚实面对:零和博弈最优非后悔框架

TL;DR本文提出了针对分散式场景中双方零和博弈问题的算法,提供了最佳的诚实遗憾和对抗遗憾率,解决了收敛到游戏价值的对数项的开放问题,并通过乐观的镜像下降算法与鲁棒的乐观镜像下降算法的信号传递方案相结合,实现了最佳结果。