基于顺序潜力的球员评分
本文提出了一个几何框架来制定零和博弈中的智能体目标,以构建产生开放式学习的自适应目标序列,从而产生比现有算法更强的智能体集合。我们将 PSRO_rN 应用于两个高度非传递性的资源分配游戏,并发现 PSRO_rN 始终优于现有替代方案。
Jan, 2019
通过分析超过 10,000 条人类象棋比赛记录,本文重点研究了象棋游戏中存在的传递性与非传递性元素,并引入了 JiangJun 算法,这是一种蒙特卡洛树搜索(MCTS)和策略空间响应神谕(PSRO)的创新组合,旨在近似纳什均衡。我们通过一个微信小程序对算法进行了经验评估,在与人类玩家的比赛中取得了 99.41%的胜率,达到大师级水平。量化指标如相对人群表现和可视化结果证实了该算法在克服非传递性方面的有效性。
Aug, 2023
本文研究现实世界游戏(如井字棋,围棋,星际争霸 II)的几何特性并证明它们与竞技场上的旋转体结构相似。此结构形成的不对称性带来了关于学习与策略的问题,我们用 9 个现实世界两人零和对称游戏进行了实证。
Apr, 2020
本文提出了一种新的流表示法,将任意一个有限游戏分解为三个部分:潜在、谐波和非策略部分,并分析了由此分解引出的自然类的游戏(即无谐波部分和无潜在部分的游戏),证明了这些游戏具有明显不同的性质,如有纯策略 Nash 均衡和无纯策略 Nash 均衡等。同时,还给出了在潜在游戏和谐波游戏上的显式表达式,并将这些结果应用到一个任意游戏的近似均衡集合的描述中。
May, 2010
该研究证明了零和等价游戏和零和等价潜在游戏的分解定理,其中规范化游戏可以分解成零和等价游戏和规范化共同利益游戏或者分解成零和等价潜在游戏、规范化零和游戏和规范化共同利益游戏,每个游戏具有独特的平衡性质。
Feb, 2016
本文介绍了潜力博弈及其图形化版本,比较新的工作发现了潜力博弈在很多实际问题中的应用,如网络路由和拥塞,分布式资源分配和图像分割等,图形潜力博弈具有协调、局部相互作用、格点、拥塞和派系等几种类型,通过概率图模型的相关结果,本文提供了几种图形潜力博弈的表述方法,并证明了特定类型的博弈规则的收敛意味着参与者必须嵌入某些图形潜力博弈中。
May, 2015
通过将收益视为更高阶变化的力量,即指定玩家进化的加速度而不是速度,我们推导出了广泛的高阶博弈动力学,并证明了更高阶的收益单调动力学导致弱支配策略的消失,随后是严格支配策略的迭代删除,从而提供了迪凯尔和弗登伯格(1990)所知的认知合理化过程的动态理由。
Jun, 2012
我们研究了一种称为 “Bidding Games” 的游戏类别,它是一种双人零和图游戏。通过限制出价的粒度并将更高的出价支付给存款银行,我们首次考虑了 “贫民离散出价”。我们的研究着眼于 “阈值预算”,即确保玩家 1 针对给定玩家 2 预算赢得游戏所需的必要和充分初始预算。
Jul, 2023
本文提出了一个双人的非本地博弈模型 $(G,H)$- 同构博弈,通过量子策略和非信号策略来定义同构的概念,证明了非信号同构与分数同构一致,刻画了量子同构与两个多项式系统的可行性之间的关系,构造了将线性二进制约束系统博弈转化为同构博弈的方案,并阐明了在张量积和交错秩序下的量子同构及其不可判定性。
Nov, 2016