蒙特卡罗树搜索与自动化机器学习

Jun, 2019

蒙特卡罗树搜索与自动化机器学习

Automated Machine Learning with Monte-Carlo Tree Search

Herilalaina Rakotoarison, Marc Schoenauer, Michèle Sebag

TL;DR在 AutoML 任务中，使用基于蒙特卡罗树搜索（MCTS）的方法 Mosaic 来处理混合结构和参数昂贵的黑盒优化问题，并在基准测试中获得了统计显著的性能提升。

Abstract

The automl task consists of selecting the proper algorithm in a machine learning portfolio, and its hyperparameter values, in order to deliver the best performance on the dataset at hand. Mosaic, a monte-carlo tree sear

automl monte-carlo tree search optimization ensembling machine learning

发现论文，激发创造

蒙特卡洛树搜索：近期修改和应用综述

本文调查了 Monte Carlo Tree Search (MCTS) 在领域特定修改和混合方法方面的应用，这种方法依赖于智能树搜索并平衡探索和利用。

Mar, 2021

使用 MCTSnets 学习搜索

该论文提出了一种名为 MCTSnet 的体系架构，其将基于模拟的搜索嵌入神经网络中，并通过向量嵌入扩展，评估和备份。该网络的参数进行端到端的训练优化，应用于小范围的搜索中，显著优于 MCTS 基线的性能。

Feb, 2018

蒙特卡罗树下降用于黑盒优化

本文研究了在黑盒优化中通过引入 Monte Carlo Tree Search 方法和结合具备随机搜索功能和高斯过程的新下降方法等技术，以实现更快速的优化。实验结果表明，所提出的方法在各种有挑战性的基准问题上表现优越。

Nov, 2022

3D 场景理解的蒙特卡罗场景搜索

本论文探讨了如何利用通用 AI 算法进行 3D 场景理解来减少训练数据的需求，并提出了一种修改的蒙特卡洛树搜索算法，以从嘈杂的 RGB-D 扫描中检索对象和房间布局。在 ScanNet 数据集上应用本算法可以得到比一些手动注释更好的配置。

Mar, 2021

通过关注未知的蒙特卡洛树搜索提升探索能力

AmEx-MCTS is a novel formulation of Monte-Carlo tree search that decouples value updates, visit count updates, and the selected path, resulting in a considerably broader search using identical computational resources and surpassing classical MCTS and related approaches.

Feb, 2024

使用深度神经网络和蒙特卡罗树搜索进行神经架构搜索

本文提出了一个名为 AlphaX 的新型可扩展 Monte Carlo Tree Search (MCTS) NAS 代理，该代理通过元深度神经网络 (DNN) 预测网络准确度，进而优化探索效率，降低网络评估成本，且在 CIFAR-10、ImageNet 和 NASBench-101 数据集上均取得了优异的结果。

May, 2018

多代理路径规划的蒙特卡洛树搜索：初步结果

研究了多智能体路径规划中如何利用蒙特卡洛树搜索（Monte-Carlo Tree Search）解决问题，提出了一种适用于多智能体路径规划的改进 MCTS 变种，通过计算个体路径和奖励来指导搜索过程，实验证明该方法优于基线规划算法。

Jul, 2023

带蒙特卡罗树搜索的优先级架构抽样

通过基于 Monte Carlo 树搜索的采样策略，依赖于各层之间的关系，使用节点通信和分层选择方法以实现更好的探索和利用平衡，并构建了一个基于 CIFAR-10 的宏搜索空间的开源 NAS 基准测试 NAS-Bench-Macro，从而显著提高了搜索效率和性能。

Mar, 2021

单智能体优化：通过蒙特卡罗树搜索进行策略迭代

本文提出了一种使用基于 Monte-Carlo Tree Search 和深度强化学习相结合的方法的搜索算法，通过 1）用于潜在无限奖励问题的新颖行动价值规范机制，2）定义虚拟损失函数实现有效搜索并行化，以及 3）由自我对弈逐代训练的策略网络引导搜索，来提高搜索算法的效果。我们在同类游戏 SameGame 上进行实验，结果表明我们的算法在多个游戏宽度上优于基准算法，并与公共状态搜索问题的最新算法竞争力相当。

May, 2020

局限严重应用中的自动机器学习

本文提出了一种名为 Caml 的元学习方法，可以自动适应其自身 AutoML 参数，以优化特定任务的高性能管道，并可以考虑用户定义的应用约束条件，以获得满足约束条件的高预测性能的管道。

Jun, 2023