蒙特卡罗树搜索与自动化机器学习
本文调查了 Monte Carlo Tree Search (MCTS) 在领域特定修改和混合方法方面的应用,这种方法依赖于智能树搜索并平衡探索和利用。
Mar, 2021
该论文提出了一种名为 MCTSnet 的体系架构,其将基于模拟的搜索嵌入神经网络中,并通过向量嵌入扩展,评估和备份。该网络的参数进行端到端的训练优化,应用于小范围的搜索中,显著优于 MCTS 基线的性能。
Feb, 2018
本文研究了在黑盒优化中通过引入 Monte Carlo Tree Search 方法和结合具备随机搜索功能和高斯过程的新下降方法等技术,以实现更快速的优化。实验结果表明,所提出的方法在各种有挑战性的基准问题上表现优越。
Nov, 2022
本论文探讨了如何利用通用 AI 算法进行 3D 场景理解来减少训练数据的需求,并提出了一种修改的蒙特卡洛树搜索算法,以从嘈杂的 RGB-D 扫描中检索对象和房间布局。在 ScanNet 数据集上应用本算法可以得到比一些手动注释更好的配置。
Mar, 2021
AmEx-MCTS is a novel formulation of Monte-Carlo tree search that decouples value updates, visit count updates, and the selected path, resulting in a considerably broader search using identical computational resources and surpassing classical MCTS and related approaches.
Feb, 2024
本文提出了一个名为 AlphaX 的新型可扩展 Monte Carlo Tree Search (MCTS) NAS 代理,该代理通过元深度神经网络 (DNN) 预测网络准确度,进而优化探索效率,降低网络评估成本,且在 CIFAR-10、ImageNet 和 NASBench-101 数据集上均取得了优异的结果。
May, 2018
研究了多智能体路径规划中如何利用蒙特卡洛树搜索(Monte-Carlo Tree Search)解决问题,提出了一种适用于多智能体路径规划的改进 MCTS 变种,通过计算个体路径和奖励来指导搜索过程,实验证明该方法优于基线规划算法。
Jul, 2023
通过基于 Monte Carlo 树搜索的采样策略,依赖于各层之间的关系,使用节点通信和分层选择方法以实现更好的探索和利用平衡,并构建了一个基于 CIFAR-10 的宏搜索空间的开源 NAS 基准测试 NAS-Bench-Macro,从而显著提高了搜索效率和性能。
Mar, 2021
本文提出了一种使用基于 Monte-Carlo Tree Search 和深度强化学习相结合的方法的搜索算法,通过 1)用于潜在无限奖励问题的新颖行动价值规范机制,2)定义虚拟损失函数实现有效搜索并行化,以及 3)由自我对弈逐代训练的策略网络引导搜索,来提高搜索算法的效果。我们在同类游戏 SameGame 上进行实验,结果表明我们的算法在多个游戏宽度上优于基准算法,并与公共状态搜索问题的最新算法竞争力相当。
May, 2020
本文提出了一种名为 Caml 的元学习方法,可以自动适应其自身 AutoML 参数,以优化特定任务的高性能管道,并可以考虑用户定义的应用约束条件,以获得满足约束条件的高预测性能的管道。
Jun, 2023