Feb, 2024

谁先行动?优化斯塔克伯格博弈中的游戏顺序与多个机器人

TL;DR我们考虑了多智能体空间导航问题,在 N 个参与者的 Stackelberg 轨迹游戏中计算社会最优的游戏顺序,即代理人做出决策的顺序以及与之相关的均衡。我们将该问题建模为一个混合整数优化问题,通过求解所有可能的与游戏顺序排列相关的 Stackelberg 游戏的空间。为了解决这个问题,我们引入了一种高效且精确的算法 Branch and Play (B&P),该算法证明了能收敛于社会最优的游戏顺序和其 Stackelberg 均衡。作为 B&P 的子程序,我们使用并扩展了序列轨迹规划,即一种流行的多智能体控制方法,以可扩展的方式计算给定游戏顺序的有效本地 Stackelberg 均衡。我们通过协调空中交通管制、群体形成和交付车队来展示 B&P 的实际用途。我们发现 B&P 比各种基准方案表现得更好,并计算出了社会最优均衡。