Bayes 相关均衡和无悔动态
通过适应性算法的考虑以确保比修改行为所能达到的结果更好,我们可以基于相关学习动态产生新的博弈理论分析,这样做比基于平衡策略算法更加有效,因为前者可以处理非零和多人博弈问题。我们重新审视了博弈理论中的中介均衡和偏差类型,证明了没有可行的概念包含所有其他类型,并引出了一个追溯与规避策略算法的平衡类别的定义。
Dec, 2020
本文研究了在完备回忆且 n 个玩家泛化和值和的博弈中,如何从简单无耦合的后悔最小化学习动力学中导出 EFCE。研究结果提供了第一个收敛于 EFCE 的无耦合动力学,为该领域解决了开放性问题。
Apr, 2021
本文提出了一种新的算法方法来解决优化一些目标(如社会福利)的相关均衡问题,并且给出了一种适用于所有紧凑表示的足够条件,同时利用该算法方法将最优 CE 问题转化为调整偏差的社会福利问题,这个框架可以识别出新的类别的博弈,其中包括基于树图的图形多项式博弈。同样使用类似的方法,我们导出了一种足够的条件来处理最优粗糙相关均衡问题,并使用其证明了单例拥塞博弈的可跟踪性。
Sep, 2011
我们模拟独立强化学习算法在 Crawford 和 Sobel (1982) 的战略信息传输游戏中的行为,显示出训练一起的发送方和接收方收敛到接近游戏先验最优均衡的策略,从而在代理之间的利益冲突程度给出的前提下,按照 Nash 均衡预测发生最大程度的通信。我们发现这个结论在超参数和游戏的替代规范下是稳健的。我们讨论了对信息传输游戏中均衡选择理论、计算机科学中算法间新兴通信的作用以及市场中由人工智能代理人组成的勾结经济的影响。
Oct, 2023
本文研究多人随机博弈中同时学习的问题,通过生成算法获得相关均衡,包括 extensive-form correlated equilibrium 和普通 coarse correlated equilbrium,并提供了一些能够多项式时间内解决的特殊情况。
Oct, 2022
该论文研究了在一个允许算法在纯策略配置上查询玩家收益的模型中寻找 $n$ 个玩家博弈的相关均衡的复杂性,结果表明随机规避后悔的动态算法可以高效地得出近似相关均衡,但确切相关均衡需要更多的回报查询(随机算法瓶颈)并无法使用高效的确定性算法(因为查询次数下限)。
May, 2013
本文提出一种针对不完全信息的博弈模式下具有更快学习速度的学习动态方案,并对其进行实验验证。其中,主要技术贡献为通过预测实现加速 Phi-regret 最小化,并通过对于有结构的马尔科夫链的细致扰动分析,表征与之相关的 fixed points 的稳定性。
Feb, 2022
本文研究了在图形网络游戏中使用分布式八卦方法寻找纳什均衡的方法,介绍了干扰图和通信图的概念,设计了通信图以使玩家仅交换必要的信息,证明了使用干扰和通信图的八卦方法在收敛步长逐渐缩小的情况下能够几乎一定收敛于纳什均衡。
Mar, 2017
该论文研究了多人游戏中,玩家间某种形式的通信建模的解概念,着重探讨了顺序博弈中的粗糙相关均衡(CCEs)并提出了 CFR 及其变体算法,其中 CFR-Jr 的效率比 CFR-S 和当前最先进的计算 CCEs 算法都要快且可行。
Oct, 2019