Mar, 2023

基于证明数的蒙特卡罗树搜索

TL;DR本文提出了一种新的游戏搜索算法,PN-MCTS,该算法将 Monte-Carlo 树搜索(MCTS)和证明数搜索(PNS)相结合。我们定义了三个领域,在这些领域中,在 MCTS 树中收集的证明和反证号所提供的额外知识可能会被使用。在不同的时间设置中测试了所有可能的组合,并与几个游戏进行了对抗。实验表明,PN-MCTS 在 5 个游戏领域中(Gomoku 除外)自信地优于 MCTS,Lines of Action 的胜率高达 96.2%。