Feb, 2023

无耦合学习承诺微分斯塔克尔贝格均衡

TL;DR通过非耦合学习过程,本文提出一个新的学习规则,能够仅仅依靠每个玩家对其他玩家行为的观察,推动玩家向局部 Stackelberg 均衡演化,本规则对人工智能合作和多智能体强化学习具有潜在应用。