Sep, 2019
一种用于广义和可扩展博弈中的双极预测采样算法近似求解斯塔克尔伯格均衡
Double-oracle sampling method for Stackelberg Equilibrium approximation
in general-sum extensive-form games
TL;DR本论文提出了一种新的方法来近似求解弱Stackelberg均衡,方法基于Follower策略空间的引导式Monte Carlo树搜索和Leader的行为策略树建立,并在用于三个不同拓扑结构的博弈测试中取得了优异的效果,较传统方法更具实用性和时间可扩展性。