Aug, 2021

一般博弈中的近似最优无悔学习

TL;DR研究证明,在多人博弈中使用乐观博弈算法可以实现对数级别的后悔,并可以在一般的游戏中以 $\tilde {O}(1/T)$ 的速率收敛到粗略的相关均衡状态。