Jul, 2023

多玩家零和马尔可夫网络分离交互博弈

TL;DR我们研究了一类新的马尔可夫博弈模型,即具有网络可分离相互作用的多人零和马尔可夫博弈,用于建模非合作多智体序贯决策中的局部交互结构。我们提出了多人零和马尔可夫博弈的必要和充分条件,并证明了在这些博弈中,马尔可夫粗相关均衡集合等同于马尔可夫纳什均衡集合。此外,我们提出了一种模拟正规形式博弈中的经典学习动态的方法,并在星形网络结构下证明了收敛性保证。最后,针对计算马尔可夫非稳态纳什均衡的难题,我们提供了一系列基于值迭代的算法,并通过数值实验验证了我们的理论结果。