ICLROct, 2022

连续蒙特卡罗图搜索

TL;DR本文提出了 Continuous Monte Carlo Graph Search(CMCGS),一种将 Monte Carlo Tree Search(MCTS)扩展到连续状态和动作空间的在线规划方法,并在 DeepMind Control Suite 基准测试和 2D 导航任务中表现优异。