Oct, 2017

实时策略游戏的组合多臂赌博机

TL;DR本文主要介绍在计算机游戏中使用的 Monte Carlo Tree Search 算法中的采样策略 —— naive sampling,结合 Combinatorial Multi-armed Bandits 问题进行分析和比较,并在实时策略游戏中进行了验证。实验结果表明,在分支因子增加的情况下,naive sampling 比其他采样策略更有效。