Mar, 2025
Stackelberg游戏中相关政策的模仿学习
Imitation Learning of Correlated Policies in Stackelberg Games
TL;DR本研究解决了在Stackelberg游戏中传统多智能体模仿学习方法无法有效捕捉智能体间复杂互动的问题。通过引入一种专门为Stackelberg游戏设计的相关政策占用度量方法和潜在Stackelberg差分网络(LSDN),该方法有效分离环境影响与智能体驱动的转变,显著简化学习过程。实验结果表明,LSDN在重现复杂互动动态方面优于现有方法,具有潜在的广泛应用价值。