May, 2017

序贯配置的均衡

TL;DR本研究探讨了序贯配置下的策略性行为,特别是考虑到 Nash 均衡、纯策略 均衡的计算和 Pareto 最优。研究表明,即使对于两个代理人,更好的应对也可以循环。研究结果提供了一个在纯 Nash 均衡下的结果,并且可以通过 “bluff profile” 的形式实现。此外,研究还展示了针对两个代理人的最佳 Stackelberg 策略的动态规划。