Jul, 2022

解决搜索问题的 AlphaZero 启发方法

TL;DRAlphaZero 和 MuZero 是使用机器学习技术进行超级人类棋类游戏表现的程序,并尝试将其应用于解决搜索问题,本文描述了在搜索问题中如何使用 AlphaZero 技术进行表示以及求解规则,并提出了适用于该类问题的一种 Monte Carlo tree search 方法。