用蒙特卡罗搜索推翻谱图论猜想
本研究提出了一种新的猜想反驳算法,名为 AMCS 算法,通过修改蒙特卡洛树搜索算法获得,旨在更有效地帮助研究人员测试图论猜想,并在多项图论猜想中得到了较好的应用。
Jun, 2023
本文介绍了一种称为 PN-MCTS 的新方法,它将 Proof-Number Search 和 Monte-Carlo Tree Search 相结合,将证明和证伪数的概念纳入 MCTS 的 UCT 公式中,实验结果表明,PN-MCTS 在几种游戏中表现优于基本的 MCTS,包括行动路线、MiniShogi、Knightthrough 和 Awari,取得了高达 94.0% 的胜率。
Jun, 2022
本文提出了一种新的游戏搜索算法,PN-MCTS,该算法将 Monte-Carlo 树搜索(MCTS)和证明数搜索(PNS)相结合。我们定义了三个领域,在这些领域中,在 MCTS 树中收集的证明和反证号所提供的额外知识可能会被使用。在不同的时间设置中测试了所有可能的组合,并与几个游戏进行了对抗。实验表明,PN-MCTS 在 5 个游戏领域中(Gomoku 除外)自信地优于 MCTS,Lines of Action 的胜率高达 96.2%。
Mar, 2023
本文研究在复杂的部分可观测的随机博弈中,两种用于决策的蒙特卡洛采样搜索技术,MCTS 和 MCCFR。作者发现 MCTS 能较快地找到一种强策略而 MCRNR 学得更快。
Jan, 2014
通过提出一种新的框架,使用顺序蒙特卡罗方法对概率图模型进行推断,其目的是通过针对辅助分布来逼近概率图模型定义的全联合分布,并用于构建一般 PGM 的高维块采样算法。
Feb, 2014
本文介绍了一种新的适应性 SMD 方法,该方法使用了 Kullback-Leibler 散度的近似来自动适应提议分布,该方法非常灵活,适用于任何参数化的提议分布,并支持在线和批处理变量,我们使用新框架来适应基于神经网络的强大提议分布,从而导致神经自适应序贯蒙特卡洛,实验表明,在非线性状态空间模型中,NASMC 显着改善了推断,优于自适应提议方法,包括扩展卡尔曼和无味粒子滤波器,也表明当 NASMC 用作粒子分辨率 Metropolis Hastings 的子程序时,改进的推断可转化为参数学习的改进。最后,我们展示 NASMC 能够训练潜在变量递归神经网络(LV-RNN),达到与多态音乐建模的最新水平竞争的结果。NASMC 可以看作是将自适应 SMC 方法与最近的可扩展的黑箱变分推理工作之间的桥梁。
Jun, 2015
通过基于 Monte Carlo 树搜索的采样策略,依赖于各层之间的关系,使用节点通信和分层选择方法以实现更好的探索和利用平衡,并构建了一个基于 CIFAR-10 的宏搜索空间的开源 NAS 基准测试 NAS-Bench-Macro,从而显著提高了搜索效率和性能。
Mar, 2021
本文提出了 Continuous Monte Carlo Graph Search(CMCGS),一种将 Monte Carlo Tree Search(MCTS)扩展到连续状态和动作空间的在线规划方法,并在 DeepMind Control Suite 基准测试和 2D 导航任务中表现优异。
Oct, 2022