模拟器上的多样化，Top-k 和 Top-Quality 规划

Aug, 2023

模拟器上的多样化，Top-k 和 Top-Quality 规划

Diverse, Top-k, and Top-Quality Planning Over Simulators

Lyndon Benke, Tim Miller, Michael Papasimeon, Nir Lipovetzky

TL;DR使用蒙特卡洛树搜索方法来解决无法使用经典规划器解决的问题，并在路径规划问题中演示了该方法可以生成多样化和高质量的计划集合。

Abstract

Diverse, top-k, and top-quality planning are concerned with the generation of sets of solutions to sequential decision problems. Previously this area has been the domain of classical planners that require a symbo

diverse planning top-k planning top-quality planning monte carlo tree search sequential decision problems

发现论文，激发创造

蒙特卡洛树搜索：近期修改和应用综述

本文调查了 Monte Carlo Tree Search (MCTS) 在领域特定修改和混合方法方面的应用，这种方法依赖于智能树搜索并平衡探索和利用。

Mar, 2021

面向目标导向规划的分治蒙特卡罗树搜索

提出了一种名为 DC-MCTS 的计划算法，用于解决目标导向的强化学习问题，该算法通过给出中间子目标来逐步划分初始任务，并独立递归地解决更简单的任务，从而实现改进策略，使规划顺序具有灵活性，得到了在格子世界和各种连续控制环境中的强大表现。

Apr, 2020

使用 MCTSnets 学习搜索

该论文提出了一种名为 MCTSnet 的体系架构，其将基于模拟的搜索嵌入神经网络中，并通过向量嵌入扩展，评估和备份。该网络的参数进行端到端的训练优化，应用于小范围的搜索中，显著优于 MCTS 基线的性能。

Feb, 2018

蒙特卡罗规划：理论上的快速收敛遇见实际上的高效率

该研究通过合理连接基于 MCTS 的两种不同种类算法来实现在短时间内寻求合理 good action，同时保持 BRUE 算法的优秀的收敛性能和指数级性能提高的保障。

Sep, 2013

统一和认证高质量规划

这篇论文将现有的定义统一为一种基于支配关系的定义，证明了不同的计算问题实际上对应于不同的支配关系，提出了一种有效证明各种高质量规划问题的方法，并提出了一种新的转化方法以有效证明无循环的高质量规划。

Mar, 2024

C-MCTS：蒙特卡洛树搜索进行安全规划

提出了一种基于 Constrained MCTS 框架的采样式规划算法，使用安全性评论家评估代理的代价，能更有效地满足代价约束条件，且在模型不匹配时更少受到代价违规的影响。

May, 2023

连续蒙特卡罗图搜索

本文提出了 Continuous Monte Carlo Graph Search（CMCGS），一种将 Monte Carlo Tree Search（MCTS）扩展到连续状态和动作空间的在线规划方法，并在 DeepMind Control Suite 基准测试和 2D 导航任务中表现优异。

Oct, 2022

蒙特卡洛树搜索发现多样模式的任意时间方法

通过 Monte Carlo 树搜索算法解决模式挖掘的多样性问题，该算法具有高效性和通用性。

Sep, 2016

多代理路径规划的蒙特卡洛树搜索：初步结果

研究了多智能体路径规划中如何利用蒙特卡洛树搜索（Monte-Carlo Tree Search）解决问题，提出了一种适用于多智能体路径规划的改进 MCTS 变种，通过计算个体路径和奖励来指导搜索过程，实验证明该方法优于基线规划算法。

Jul, 2023

经验引导的蒙特卡罗树搜索在反合成规划中的应用

本文提出了一种名为 MCTS 的基于模拟退火算法的反合成规划方法，使用 Experience Guidance Network 从化学合成经验中学习知识，实现有效处理拥有巨大可能性的化学反应，实验结果证明在效率和功效上均优于现有研究成果。

Dec, 2021