本文调查了 Monte Carlo Tree Search (MCTS) 在领域特定修改和混合方法方面的应用,这种方法依赖于智能树搜索并平衡探索和利用。
Mar, 2021
提出了一种名为 DC-MCTS 的计划算法,用于解决目标导向的强化学习问题,该算法通过给出中间子目标来逐步划分初始任务,并独立递归地解决更简单的任务,从而实现改进策略, 使规划顺序具有灵活性,得到了在格子世界和各种连续控制环境中的强大表现。
Apr, 2020
该论文提出了一种名为 MCTSnet 的体系架构,其将基于模拟的搜索嵌入神经网络中,并通过向量嵌入扩展,评估和备份。该网络的参数进行端到端的训练优化,应用于小范围的搜索中,显著优于 MCTS 基线的性能。
Feb, 2018
该研究通过合理连接基于 MCTS 的两种不同种类算法来实现在短时间内寻求合理 good action,同时保持 BRUE 算法的优秀的收敛性能和指数级性能提高的保障。
Sep, 2013
这篇论文将现有的定义统一为一种基于支配关系的定义,证明了不同的计算问题实际上对应于不同的支配关系,提出了一种有效证明各种高质量规划问题的方法,并提出了一种新的转化方法以有效证明无循环的高质量规划。
Mar, 2024
提出了一种基于 Constrained MCTS 框架的采样式规划算法,使用安全性评论家评估代理的代价,能更有效地满足代价约束条件,且在模型不匹配时更少受到代价违规的影响。
May, 2023
本文提出了 Continuous Monte Carlo Graph Search(CMCGS),一种将 Monte Carlo Tree Search(MCTS)扩展到连续状态和动作空间的在线规划方法,并在 DeepMind Control Suite 基准测试和 2D 导航任务中表现优异。
Oct, 2022
通过 Monte Carlo 树搜索算法解决模式挖掘的多样性问题,该算法具有高效性和通用性。
Sep, 2016
研究了多智能体路径规划中如何利用蒙特卡洛树搜索(Monte-Carlo Tree Search)解决问题,提出了一种适用于多智能体路径规划的改进 MCTS 变种,通过计算个体路径和奖励来指导搜索过程,实验证明该方法优于基线规划算法。
Jul, 2023
本文提出了一种名为 MCTS 的基于模拟退火算法的反合成规划方法,使用 Experience Guidance Network 从化学合成经验中学习知识,实现有效处理拥有巨大可能性的化学反应,实验结果证明在效率和功效上均优于现有研究成果。
Dec, 2021