Mar, 2024

策略优化在正则化广义和 LQ 博弈中找到纳什均衡

TL;DR研究引入相对熵正则化对 General-Sum $N$-agent games 的 Nash Equilibria 的影响,揭示了该类游戏的 NE 符合线性高斯策略。此外,本文提出了符合熵正则化充分条件的 NE 唯一性,并证明了在 Policy Optimization 算法中线性收敛性,该算法在熵正则化充分条件下能达到 NE。此外,在熵正则化不足的情况下,我们还提出了一种 δ 增强技术,可实现游戏中的 ε-NE。