Jun, 2017

最佳臂识别的蒙特卡罗树搜索

TL;DR通过总结深层树结构的置信区间并在根节点应用最佳选择算法,我们开发了一种新的算法来解决游戏树搜索问题,并证明了样本复杂度保证具有对问题实例的精细依赖性。实验证明,与现有的基于排除算法和深度为2的树的专用方法相比,我们的算法具有更好的表现。