Jun, 2023
驯服指数级行动集:在在线拥塞博弈中实现次线性遗憾和快速收敛到纳什均衡
Taming the Exponential Action Set: Sublinear Regret and Fast Convergence to Nash Equilibrium in Online Congestion Games
Jing Dong, Jingyu Wu, Siwei Wang, Baoxiang Wang, Wei Chen
TL;DR本研究通过提出 CongestEXP 算法来解决在线拥塞博弈问题,通过在设施级别上维护权重,创新性地规避了指数级依赖于可能的设施集合大小的遗憾界,并且适用于任何个体玩家,并在存在严格纳什均衡时,能以近似指数速度收敛至纳什策略。