Feb, 2023
无耦合学习承诺微分斯塔克尔贝格均衡
Uncoupled Learning of Differential Stackelberg Equilibria with Commitments
Robert Loftin, Mustafa Mert Çelikok, Herke van Hoof, Samuel Kaski, Frans A. Oliehoek
TL;DR通过非耦合学习过程,本文提出一个新的学习规则,能够仅仅依靠每个玩家对其他玩家行为的观察,推动玩家向局部 Stackelberg 均衡演化,本规则对人工智能合作和多智能体强化学习具有潜在应用。