Aug, 2019

解决折扣随机二人博弈问题的近似最优时间和样本复杂度

TL;DR本文研究解决折扣二人零和随机游戏的采样复杂度,并提出一种计算策略的算法以及推广现有的 MDP 算法到多代理设置。