Sep, 2013

蒙特卡罗规划:理论上的快速收敛遇见实际上的高效率

TL;DR该研究通过合理连接基于 MCTS 的两种不同种类算法来实现在短时间内寻求合理 good action,同时保持 BRUE 算法的优秀的收敛性能和指数级性能提高的保障。