Sep, 2019

一种用于广义和可扩展博弈中的双极预测采样算法近似求解斯塔克尔伯格均衡

TL;DR本论文提出了一种新的方法来近似求解弱Stackelberg均衡,方法基于Follower策略空间的引导式Monte Carlo树搜索和Leader的行为策略树建立,并在用于三个不同拓扑结构的博弈测试中取得了优异的效果,较传统方法更具实用性和时间可扩展性。