AAAIFeb, 2022

广义和粗糙相关均衡的更快无悔学习动态

TL;DR本文提出一种针对不完全信息的博弈模式下具有更快学习速度的学习动态方案,并对其进行实验验证。其中,主要技术贡献为通过预测实现加速 Phi-regret 最小化,并通过对于有结构的马尔科夫链的细致扰动分析,表征与之相关的 fixed points 的稳定性。