Feb, 2024

解决层次化信息共享 Dec-POMDPs 的广义形式博弈方法

TL;DR本文展示了如何在保持优化性的同时,通过分层信息共享来解开多个玩家的决策变量,应用最优性原理将一个单个阶段的子游戏进一步分解为更小的子游戏,从而使我们能够一次进行单个玩家的决策。我们的研究结果表明,利用这些发现的算法可以扩展到更大的多人游戏而不损害优化性。