Oct, 2022

在 miniXCOM 中探索使用 TD 学习的自适应 MCTS

TL;DR本文介绍了一种名为 MCTS-TD 的自适应 MCTS 算法,该算法使用了深度强化学习技术,从而无需预训练模型即可实现在线调整,通过在 miniXCOM 游戏中进行测试,进一步证明了该算法的有效性。