Jan, 2023

基于N元组强化学习的魔方学习

TL;DR本文介绍了使用通用棋盘游戏(GBG)计算框架学习和解决魔方游戏(或谜题)的方法,详细讨论了魔方的状态表示、变换方式和使用对称性。通过强化学习训练代理,通过MCTS包装提高训练代理性能,表明MCTS包装和对称性增加了计算成本,但同时也得到了更好的效果。与已有魔方学习代理相比,该方法计算成本较低。