带有单边信息的受状态限制的零和微分博弈

Mar, 2024

带有单边信息的受状态限制的零和微分博弈

State-Constrained Zero-Sum Differential Games with One-Sided Information

Mukesh Ghimire, Lei Zhang, Zhe Xu, Yi Ren

TL;DR我们研究了带有状态约束和单侧信息的零和微分博弈，其中被告知的玩家（玩家 1）具有未知于未告知玩家（玩家 2）的分类奖励类型。玩家 1 的目标是在不违反约束的情况下最小化他的奖励，而玩家 2 的目标是要么违反状态约束，要么最大化奖励。我们的理论贡献是将这一结果扩展到带有状态约束的微分博弈，并导出计算行为策略所必需的原始和对偶子动态规则。与现有关注可伸缩性和泛化性的不完全信息动态博弈研究相比，我们关注的是揭示由于信息不对称和状态约束而导致的信念操纵行为的机制。我们使用简化的足球比赛来证明这项工作的实用性，我们揭示了攻击者应该（或不应该）在特定随机虚假行动中利用信息不对称的玩家位置和信念状态，并计算出防守者应该如何应对。

Abstract

We study zero-sum differential games with state constraints and one-sided information, where the informed player (Player 1) has a categorical payoff type unknown to the uninformed player (Player 2). The goal of P

zero-sum differential games state constraints information asymmetry belief manipulation behaviors behavioral strategies

发现论文，激发创造

应对策略限制的大规模扩展博弈求解

研究表明，通过推广反事实遗憾最小化，我们可以解决一般约束下的最优策略问题，并且该算法可广泛应用于复杂博弈中，如安全博弈中的风险缓解和扑克游戏中的对手建模。

Sep, 2018

对抗性团队游戏的公共信息表示

通过将序列团队游戏转化为经典二人零和游戏，并提供三种信息不损失抽象，本文有效地应用了现有算法于互弈博弈中。

Jan, 2022

基于推断的一般求和差分博弈策略对齐

文章提出了一个通用框架，通过推断其他代理方的平衡状态来解决不确定性问题，并在多人机器人导航问题的模拟中证明，通过对准平衡状态，机器人可以更准确地预测轨迹并降低所有玩家的成本。

Feb, 2020

将不完备信息从双人零和博弈中抽象出来

研究表明，通过公开玩家策略，可以从常见的收益游戏中摆脱不完美的信息，但同样的方法不能应用于两人零和游戏，该论文提出利用正则化平衡的方法来解决这个问题，以便计算这些均衡点可以被视为完美信息问题。

Jan, 2023

双人零和博弈中智能体理性的大规模学习

这篇论文介绍了一种应用于实际情境下的框架，用于推断底层博弈参数，其中包括了基于决策理论的行为模型，用于学习复杂博弈中有理智的行为，并利用第一阶原始 - 对偶方法扩展了有效的端到端学习算法和简化博弈求解和梯度计算的计算。

Mar, 2019

具有独立状态过程的有限成本耦合随机博弈

本文研究了具有特殊结构的非协作约束随机博弈，证明了其中纳什均衡存在性，并给出了无线通信中功率控制的应用例子。

Mar, 2007

学习在没有知识的情况下玩随机完全信息双人游戏

本文将 Descent 框架从完全信息的两人博弈扩展至随机博弈领域，并探讨了两种方法的实现和效果，其中 Descent 的泛化在 EinStein wurfelt nicht! 游戏中取得了最佳效果，而通过确定性游戏的近似仍然取得了良好的结果，可见其在特定场景下可能会取得更好的效果。

Feb, 2023

HSVI 能够解决零和部分可观察随机博弈

通过数学分析并且创新引入 HSV1-like 算法解决动态规划问题，其优于现有的线性规划和迭代方法。

Oct, 2022

对抗性游戏中的决策分析

本文从多个角度对对抗博弈中三种主要的游戏模型（零和标准型和扩展型游戏，Stakelberg 安全游戏和零和微分游戏）进行了系统的调研，涵盖了游戏模型基础知识，平衡概念，问题分类，研究前沿，最优策略寻找技术，主要算法和实际应用，并探讨了未来的研究方向。

Jul, 2022

行为受限零和博弈中的遗憾最小化

使用 CFR 框架开发算法以解决行为约束的 extensive-form games，同时计算近似 Nash 平衡改进。比标准算法更好，收敛速率与最先进的 Nash 平衡计算算法相当。

Nov, 2017