BriefGPT.xyz
Ask
alpha
关键词
n-player games
搜索结果 - 2
对抗无悔玩家
研究使用无遗憾算法在正态形式重复的 N 人博弈中,如何让人类玩家获得最大化效用,引入 Stackelberg 均衡和相关 Stackelberg 均衡的概念,证明玩家能够在每个回合至少保证相关 Stackelberg 期望值的效用。
PDF
2 years ago
无遗憾学习和混合纳什均衡:不能相互混合
本文研究了 no-regret 动力学中最常被考虑的动态系统之一 - Follow-the-regularized-leader 的行为,证明了非严格的纳什均衡对于 no-regret 学习是不稳定的且不能吸引该动态系统的稳定状态,因此只有
→
PDF
4 years ago
Prev
Next