Apr, 2024

蒙特卡洛树搜索与 Boltzmann 探索

TL;DR此研究以蒙特卡洛树搜索方法为基础,介绍了最大熵树搜索 (MENTS) 的局限性,并提出了两种新算法,Boltzmann 树搜索 (BTS) 和 Decaying 熵树搜索 (DENTS),以解决这些局限性,并保留了 Boltzmann 策略的优势。通过实证分析,发现这些算法在多个基准领域,包括围棋游戏,都能保持高性能。