谁先行动？优化斯塔克伯格博弈中的游戏顺序与多个机器人

Feb, 2024

谁先行动？优化斯塔克伯格博弈中的游戏顺序与多个机器人

Who Plays First? Optimizing the Order of Play in Stackelberg Games with Many Robots

Haimin Hu, Gabriele Dragotto, Zixu Zhang, Kaiqu Liang, Bartolomeo Stellato...

TL;DR我们考虑了多智能体空间导航问题，在 N 个参与者的 Stackelberg 轨迹游戏中计算社会最优的游戏顺序，即代理人做出决策的顺序以及与之相关的均衡。我们将该问题建模为一个混合整数优化问题，通过求解所有可能的与游戏顺序排列相关的 Stackelberg 游戏的空间。为了解决这个问题，我们引入了一种高效且精确的算法 Branch and Play (B&P)，该算法证明了能收敛于社会最优的游戏顺序和其 Stackelberg 均衡。作为 B&P 的子程序，我们使用并扩展了序列轨迹规划，即一种流行的多智能体控制方法，以可扩展的方式计算给定游戏顺序的有效本地 Stackelberg 均衡。我们通过协调空中交通管制、群体形成和交付车队来展示 B&P 的实际用途。我们发现 B&P 比各种基准方案表现得更好，并计算出了社会最优均衡。

Abstract

We consider the multi-agent spatial navigation problem of computing the socially optimal order of play, i.e., the sequence in which the agents commit to their decisions, and its associated equilibrium in an N-pla

发现论文，激发创造

一种多智能体系统中针对临时协调的博弈论模型和最佳应答学习方法

本研究利用随机贝叶斯博弈理论，提出了 Harsanyi-Bellman Ad Hoc Coordination (HBA) 解决协调问题的方法，实验证明其在多智能体系统的logistics领域和人机交互中都具有高效性和灵活性。

Jun, 2015

一种用于广义和可扩展博弈中的双极预测采样算法近似求解斯塔克尔伯格均衡

本论文提出了一种新的方法来近似求解弱Stackelberg均衡，方法基于Follower策略空间的引导式Monte Carlo树搜索和Leader的行为策略树建立，并在用于三个不同拓扑结构的博弈测试中取得了优异的效果，较传统方法更具实用性和时间可扩展性。

Sep, 2019

对抗无悔玩家

研究使用无遗憾算法在正态形式重复的N人博弈中，如何让人类玩家获得最大化效用，引入Stackelberg均衡和相关Stackelberg均衡的概念，证明玩家能够在每个回合至少保证相关Stackelberg期望值的效用。

Feb, 2022

演化博弈理论在多智能体路径规划中的应用

本文探讨了一种基于进化博弈论思想的解决方法来解决一组同质且自主代理在未知且随机环境中的路径规划问题，研究了多智能体规划方法，并展示了我们的技术在大空间中最小化路径长度方面击败了现有的状态良好的强化学习算法近30%，并且比深度强化学习方法快至少一个数量级，并且与其他方法相比，扩展性更好，最后，我们证明了我们学到的政策在演化上是稳定的。

Dec, 2022

竞争自学时学习新兴行为的Stackelberg博弈

使用 Stackelberg Multi-Agent Deep Deterministic Policy Gradient (ST-MADDPG) 的算法，优化自我进化过程中的智能体沟通模式，提高多智能体学习的有效性和鲁棒性。

May, 2023

通过双层优化的去中心化非合作机器人社交导航

本文提出了一种全面去中心化的方法，用于社交小游戏中的实时非合作多机器人导航，使用新的实时双层优化算法来规划基于优先顺序的最优轨迹，并证明了该算法的有效性。

Jun, 2023

多代理路径规划的蒙特卡洛树搜索：初步结果

研究了多智能体路径规划中如何利用蒙特卡洛树搜索（Monte-Carlo Tree Search）解决问题，提出了一种适用于多智能体路径规划的改进MCTS变种，通过计算个体路径和奖励来指导搜索过程，实验证明该方法优于基线规划算法。

Jul, 2023

协作和竞争同时进行的零射击互动游戏的掌握

利用自我对弈和规划相结合的方法，通过模拟自我对弈学习有限理性智能体，提出了Albatross算法，在同时进行的游戏中实现合作和竞争，达到了较好的效果。

Feb, 2024

正态形式博弈的均衡路径

对于有限正规式游戏的混合延伸，本研究回答了一个关于战略动态的基本问题：对于给定的游戏和初始策略配置，是否总是可能构造一个以均衡策略终止的满足路径。

Mar, 2024

通过均衡逼近实现对同时行动博弈的树搜索

通过将自我博弈的树搜索算法应用于同时移动的游戏中，以近似粗略相关均衡为子程序的实际方法，提高了在合作、竞争和混合任务上的性能表现。

Jun, 2024