Nov, 2021

多人零和游戏中相关均衡的几乎最优无悔学习

TL;DR提出了新的技术,将DFG的技术用于解决内部遗憾和交换遗憾,从而使得多人游戏中的学习动态能够收敛到近似相关均衡,同时分析了Blum和Mansour算法中的近似最优遗憾保证。