Jun, 2023

驯服指数级行动集:在在线拥塞博弈中实现次线性遗憾和快速收敛到纳什均衡

TL;DR本研究通过提出 CongestEXP 算法来解决在线拥塞博弈问题,通过在设施级别上维护权重,创新性地规避了指数级依赖于可能的设施集合大小的遗憾界,并且适用于任何个体玩家,并在存在严格纳什均衡时,能以近似指数速度收敛至纳什策略。