Oct, 2018

观察不可见之处:一种简单的并行化蒙特卡洛树搜索方法

TL;DR提出了并行化算法 WU-UCT,引入了一组统计数据来跟踪未完成的模拟查询数量,并且这些统计数据被用于修改选择步骤中的 UCT 树策略,从而在最耗时的拓展和模拟步骤并行化时保持有效的探索 - 开发折衷,并且实验表明 WU-UCT 相比现有技术具有线性加速和卓越性能。