Mar, 2024

带有单边信息的受状态限制的零和微分博弈

TL;DR我们研究了带有状态约束和单侧信息的零和微分博弈,其中被告知的玩家(玩家 1)具有未知于未告知玩家(玩家 2)的分类奖励类型。玩家 1 的目标是在不违反约束的情况下最小化他的奖励,而玩家 2 的目标是要么违反状态约束,要么最大化奖励。我们的理论贡献是将这一结果扩展到带有状态约束的微分博弈,并导出计算行为策略所必需的原始和对偶子动态规则。与现有关注可伸缩性和泛化性的不完全信息动态博弈研究相比,我们关注的是揭示由于信息不对称和状态约束而导致的信念操纵行为的机制。我们使用简化的足球比赛来证明这项工作的实用性,我们揭示了攻击者应该(或不应该)在特定随机虚假行动中利用信息不对称的玩家位置和信念状态,并计算出防守者应该如何应对。