AAAIJul, 2020
预测性布莱克韦尔可达性加速游戏求解:联接遗憾匹配与镜像下降
Faster Game Solving via Predictive Blackwell Approachability: Connecting Regret Matching and Mirror Descent
Gabriele Farina, Christian Kroer, Tuomas Sandholm
TL;DR本文提出了预测 Blackwell 可达性算法的概念,基于在线凸优化的后悔最小化算法,得到了针对多次博弈问题的多种算法,并在 18 个经典的零和博弈模型上的实验中取得了优秀的效果。