学习马尔可夫博弈中基于密度相关均衡的策略
本文提出了一种新的算法方法来解决优化一些目标(如社会福利)的相关均衡问题,并且给出了一种适用于所有紧凑表示的足够条件,同时利用该算法方法将最优 CE 问题转化为调整偏差的社会福利问题,这个框架可以识别出新的类别的博弈,其中包括基于树图的图形多项式博弈。同样使用类似的方法,我们导出了一种足够的条件来处理最优粗糙相关均衡问题,并使用其证明了单例拥塞博弈的可跟踪性。
Sep, 2011
该论文研究了多人游戏中,玩家间某种形式的通信建模的解概念,着重探讨了顺序博弈中的粗糙相关均衡(CCEs)并提出了 CFR 及其变体算法,其中 CFR-Jr 的效率比 CFR-S 和当前最先进的计算 CCEs 算法都要快且可行。
Oct, 2019
本文研究了在完备回忆且 n 个玩家泛化和值和的博弈中,如何从简单无耦合的后悔最小化学习动力学中导出 EFCE。研究结果提供了第一个收敛于 EFCE 的无耦合动力学,为该领域解决了开放性问题。
Apr, 2021
本文提出一种针对不完全信息的博弈模式下具有更快学习速度的学习动态方案,并对其进行实验验证。其中,主要技术贡献为通过预测实现加速 Phi-regret 最小化,并通过对于有结构的马尔科夫链的细致扰动分析,表征与之相关的 fixed points 的稳定性。
Feb, 2022
研究了针对不同类型的协同均衡的最优相关策略问题,提出了相关 DAG 表示方法和双面列生成算法来计算最优策略并探讨其复杂性分析,探究了一些新的基准博弈。
Mar, 2022
本文研究了 Markov 粗粒度关联均衡问题的计算复杂性及其在多智能体强化学习中的应用,发现当多智能体交互为回合制、折扣因子和粗略程度为常数时,计算近似的 Markov 粗粒度关联均衡策略属于 NP 难问题,但是提供了在多智能体中非稳定 Markov CCE 策略的学习解决方案。
Apr, 2022
本文探讨了贝叶斯博弈的均衡概念,包括相关均衡、通信均衡,推导出基于均衡对策的博弈稳定状态的实现方法,提出一种满足稳定、高效、优化多个博弈均衡的新均衡概念。
Apr, 2023
本文提出了第一种高效算法用于学习通过较粗的相关均衡 (CCE) 和相关均衡 (CE) 合理化行为的多智能体学习,这些算法的样本复杂度与所有问题参数(包括玩家数量)的多项式成正比,同时还开发了一种新的高效算法来找到一个合理化的行动规划(不一定是均衡),该算法的样本复杂度显著优于现有结果。算法采用了几种新技术来同时保证理性和无择性遗憾,包括相关探索方案和自适应学习速率。
Oct, 2022
本文提出了一种新的算法来计算具有广泛相关性平衡的解,该算法基于一个新的双线性鞍点问题的解。此外,我们还介绍了两个基准游戏,探究冲突解决和协商领域中的广泛相关性平衡的质量特征。
May, 2019