AAAIJul, 2020

预测性布莱克韦尔可达性加速游戏求解:联接遗憾匹配与镜像下降

TL;DR本文提出了预测 Blackwell 可达性算法的概念,基于在线凸优化的后悔最小化算法,得到了针对多次博弈问题的多种算法,并在 18 个经典的零和博弈模型上的实验中取得了优秀的效果。