研究纸中提出了一种改进 Monte Carlo Tree Search (MCTS) 框架的算法,它能够在环境模型存在不完全时搜索更加确定的转换,从而提高搜索行为和性能。
Dec, 2023
本文调查了 Monte Carlo Tree Search (MCTS) 在领域特定修改和混合方法方面的应用,这种方法依赖于智能树搜索并平衡探索和利用。
Mar, 2021
本文介绍了一种基于贝叶斯框架与高斯近似算法的 Monte-Carlo Tree Search 方法,旨在更准确地估算节点价值和不确定性,并证明了该方法的在策略和非策略情境下的收敛性和实现的优越性。
Mar, 2012
本研究使用五个不同性质的函数展示了通过演化一个选择策略来改进 MCTS UCT 在多峰和欺骗性场景中效果的可能性,并且表明在单峰场景下 MCTS UCT 是鲁棒的且在本研究中使用的其余场景中具有竞争力。
Feb, 2023
该研究通过合理连接基于 MCTS 的两种不同种类算法来实现在短时间内寻求合理 good action,同时保持 BRUE 算法的优秀的收敛性能和指数级性能提高的保障。
Sep, 2013
研究提出两种方法来提高蒙特卡罗树搜索 (Monte-Carlo Tree Search,MCTS) 算法中的收敛速率和探索程度,基于引入的备份操作与熵正则化,提供强有力的理论保证,实验证明方法有效。
Feb, 2022
我们描述了一个初步的数据集,该数据集包括了 268,386 个不同游戏中的 61 个不同代理的对局,旨在研究 Monte-Carlo Tree Search 在各种游戏中的表现和改进方法,以及对数据集的预测模型训练和未来计划。
Jun, 2024
研究了多智能体路径规划中如何利用蒙特卡洛树搜索(Monte-Carlo Tree Search)解决问题,提出了一种适用于多智能体路径规划的改进 MCTS 变种,通过计算个体路径和奖励来指导搜索过程,实验证明该方法优于基线规划算法。
Jul, 2023
该论文提出了一种名为 MCTSnet 的体系架构,其将基于模拟的搜索嵌入神经网络中,并通过向量嵌入扩展,评估和备份。该网络的参数进行端到端的训练优化,应用于小范围的搜索中,显著优于 MCTS 基线的性能。
Feb, 2018
提出了并行化算法 WU-UCT,引入了一组统计数据来跟踪未完成的模拟查询数量,并且这些统计数据被用于修改选择步骤中的 UCT 树策略,从而在最耗时的拓展和模拟步骤并行化时保持有效的探索 - 开发折衷,并且实验表明 WU-UCT 相比现有技术具有线性加速和卓越性能。
Oct, 2018