本文介绍了多智能体影响图的基础概念,引入了子博弈的概念和博弈均衡。同时,证明了多智能体影响图和全局博弈图之间的等价性,并描述了一种开源的实现方法。
Feb, 2021
通过采样策略和马尔科夫蒙特卡罗方法,提出了一种基于多项式更新算法的广义博弈相关均衡计算方法,用于在多智能体系统中更高效的计算关于社会福利的均衡。
May, 2012
本研究介绍了多人博弈图模型和 Nash 平衡的计算算法,特别是在树形图的情况下,我们提出了高效的局部消息传递算法,它只涉及到与相邻节点的交互以及相对较少的全局交互,从而使得该算法可以被分布式实施。
Jan, 2013
本文综合从理论和实证的角度,回顾了计算有限正规形式博弈中纳什均衡及其近似解的各种算法,并在不同类型的博弈中对这些算法进行了综合比较,并给出了关于这些算法的实现和使用的实际建议,最后从理论和实践考虑提出了一系列开放问题。
Dec, 2023
我们提出了一种在连续状态和动作空间上利用代表性玩家进行离散时间图博游戏的建模方法,用于研究具有异质相互作用的随机博弈。相比采用无穷多个玩家的广泛采用的建模方法,该建模方法具有哲学和数学优势。我们在温和的假设下证明了图博均衡的存在性和唯一性,并展示了该均衡可用于构造网络上有限玩家博弈的近似解,这在分析和求解中面临维数灾难的挑战。我们开发了一种在线无预言学习算法来数值求解均衡,并提供了其收敛的样本复杂度分析。
May, 2024
通过发展更高效和可扩展的算法,使用稀疏迭代方法的行为扰动来解决不完全信息博弈中的纳什均衡问题,从而实现最优均衡,但不排除博弈树中未到达的子树中存在次优策略。 通过使用平滑方法,能够计算出一个近似的 extensive-form 完美均衡,以解决经典的纳什均衡算法中存在的精度问题。
May, 2017
本文提出了一个统一的框架来表征在无限维或有限维的非凸策略空间上进行连续博弈的局部 Nash 平衡,给出了确保策略构成局部 Nash 平衡的本质必要和充分一阶和二阶条件,将满足充分条件的点称为微分 Nash 平衡,进一步提供了一个充分条件(非退化性)来保证微分 Nash 平衡是孤立的,并且表明这样的平衡是结构稳定的。文章用教程示例说明结果,并且突出连续博弈中可能出现的退化。
Nov, 2014
提出了一种基于深度神经网络的算法来识别一般大型 $N$ 人随机微分博弈的马尔可夫纳什均衡,该算法的核心思想是将 $N$ 人游戏重塑为 $N$ 个解耦决策问题,并通过迭代解决。
Dec, 2019
使用梯度下降法的粒子动态法可以在高维度的情况下找到两个玩家零和持续游戏中的混合纳什均衡,该方法对于训练对抗生成网络的混合模型是有效的。
Feb, 2020
本文研究如何在大型零和博弈中计算近似纳什均衡,提出两种方法:无悔在线学习和基于凸凹点公式的梯度方法,并尝试将两种方法进行整合。