蒙特卡洛树搜索中的前瞻性病理学

Dec, 2022

蒙特卡洛树搜索中的前瞻性病理学

Lookahead Pathology in Monte-Carlo Tree Search

Khoi P. N. Nguyen, Raghuram Ramanujan

TL;DR本研究通过引入一种新的合成游戏家族，从理论和实验两个方面研究了 UCT 算法的前瞻病理学，表明 UCT 算法在一些游戏中存在病理行为。

Abstract

monte-carlo tree search (MCTS) is an adversarial search paradigm that first found prominence with its success in the domain of computer Go. Early theoretical work established the game-theoretic soundness and conv

monte-carlo tree search adversarial search upper confidence bounds applied to trees lookahead pathology synthetic games

发现论文，激发创造

在转移不确定性条件下的蒙特卡洛树搜索

研究纸中提出了一种改进 Monte Carlo Tree Search (MCTS) 框架的算法，它能够在环境模型存在不完全时搜索更加确定的转换，从而提高搜索行为和性能。

Dec, 2023

蒙特卡洛树搜索：近期修改和应用综述

本文调查了 Monte Carlo Tree Search (MCTS) 在领域特定修改和混合方法方面的应用，这种方法依赖于智能树搜索并平衡探索和利用。

Mar, 2021

蒙特卡罗树搜索中的贝叶斯推断

本文介绍了一种基于贝叶斯框架与高斯近似算法的 Monte-Carlo Tree Search 方法，旨在更准确地估算节点价值和不确定性，并证明了该方法的在策略和非策略情境下的收敛性和实现的优越性。

Mar, 2012

探索演化 MCTS UCT 选择策略的影响

本研究使用五个不同性质的函数展示了通过演化一个选择策略来改进 MCTS UCT 在多峰和欺骗性场景中效果的可能性，并且表明在单峰场景下 MCTS UCT 是鲁棒的且在本研究中使用的其余场景中具有竞争力。

Feb, 2023

蒙特卡罗规划：理论上的快速收敛遇见实际上的高效率

该研究通过合理连接基于 MCTS 的两种不同种类算法来实现在短时间内寻求合理 good action，同时保持 BRUE 算法的优秀的收敛性能和指数级性能提高的保障。

Sep, 2013

蒙特卡罗树搜索中价值备份和探索的统一视角

研究提出两种方法来提高蒙特卡罗树搜索 (Monte-Carlo Tree Search，MCTS) 算法中的收敛速率和探索程度，基于引入的备份操作与熵正则化，提供强有力的理论保证，实验证明方法有效。

Feb, 2022

不同游戏中蒙特卡罗树搜索性能的表征

我们描述了一个初步的数据集，该数据集包括了 268,386 个不同游戏中的 61 个不同代理的对局，旨在研究 Monte-Carlo Tree Search 在各种游戏中的表现和改进方法，以及对数据集的预测模型训练和未来计划。

Jun, 2024

多代理路径规划的蒙特卡洛树搜索：初步结果

研究了多智能体路径规划中如何利用蒙特卡洛树搜索（Monte-Carlo Tree Search）解决问题，提出了一种适用于多智能体路径规划的改进 MCTS 变种，通过计算个体路径和奖励来指导搜索过程，实验证明该方法优于基线规划算法。

Jul, 2023

使用 MCTSnets 学习搜索

该论文提出了一种名为 MCTSnet 的体系架构，其将基于模拟的搜索嵌入神经网络中，并通过向量嵌入扩展，评估和备份。该网络的参数进行端到端的训练优化，应用于小范围的搜索中，显著优于 MCTS 基线的性能。

Feb, 2018

观察不可见之处：一种简单的并行化蒙特卡洛树搜索方法

提出了并行化算法 WU-UCT，引入了一组统计数据来跟踪未完成的模拟查询数量，并且这些统计数据被用于修改选择步骤中的 UCT 树策略，从而在最耗时的拓展和模拟步骤并行化时保持有效的探索 - 开发折衷，并且实验表明 WU-UCT 相比现有技术具有线性加速和卓越性能。

Oct, 2018