蒙特卡洛树搜索和监督学习相结合的综合框架用于列车时刻表问题

Nov, 2023

蒙特卡洛树搜索和监督学习相结合的综合框架用于列车时刻表问题

An Integrated Framework Integrating Monte Carlo Tree Search and Supervised Learning for Train Timetabling Problem

Feiyu Yang

TL;DR这篇文章提出了一种综合的蒙特卡洛树搜索（MCTS）计算框架，通过结合启发式方法、无监督学习方法和监督学习方法来解决离散动作空间中的单轨铁路列车时刻表问题（TTP）。

Abstract

The single-track railway train timetabling problem (TTP) is an important and complex problem. This article proposes an integrated monte carlo tree search (MCTS) computing framework that combines →

single-track railway train timetabling problem monte carlo tree search heuristic methods unsupervised learning methods supervised learning methods

发现论文，激发创造

基于图表示的可扩展列车时刻表重排的强化学习

火车时刻表重新调度的研究中，通过基于强化学习的方法，设计了一个简单的有向图来表示问题，并利用图神经网络自动提取信息状态；通过改变解决方案的构建过程，使得决策模型与问题规模解耦合，确保生成方案的可行性；为模型设计了一个学习课程来处理不同程度延误的情况；并且提出了一个简单的局部搜索方法，显著提高了解决方案的质量，实验结果证明了该方法在解决各种不同程度火车延误和规模问题时比手工规则和现有解决方法具有更好的性能。

Jan, 2024

蒙特卡洛树搜索：近期修改和应用综述

本文调查了 Monte Carlo Tree Search (MCTS) 在领域特定修改和混合方法方面的应用，这种方法依赖于智能树搜索并平衡探索和利用。

Mar, 2021

使用 MCTSnets 学习搜索

该论文提出了一种名为 MCTSnet 的体系架构，其将基于模拟的搜索嵌入神经网络中，并通过向量嵌入扩展，评估和备份。该网络的参数进行端到端的训练优化，应用于小范围的搜索中，显著优于 MCTS 基线的性能。

Feb, 2018

组合优化中基于模拟树搜索的辅助代理算法

通过使用辅助模型快速计算评估的蒙特卡洛树搜索（MCTS），可以更快地生成解决方案，同时与不使用辅助模型的 MCTS 相比保持一致的解决方案。

Mar, 2024

基于数据的火车编组问题可行性确定政策

本文使用深度图卷积神经网络模型对荷兰铁路公司列车单元调遣问题进行了研究，为了提高本问题的计算效率，将神经网络模型和局部搜索启发算法相结合，提高了解决方案的预测准确率和决策速度。

Jul, 2019

在异步深度强化学习中使用蒙特卡罗树搜索作为演示器

本文介绍了一种新的深度强化学习方法 Asynchronous Advantage Actor-Critic (A3C-TP)，并提出一种新的框架，将规划算法和异步分布式深度强化学习方法相结合，相对于传统方法，提高了学习速度和收敛策略的能力。

Nov, 2018

连续蒙特卡罗图搜索

本文提出了 Continuous Monte Carlo Graph Search（CMCGS），一种将 Monte Carlo Tree Search（MCTS）扩展到连续状态和动作空间的在线规划方法，并在 DeepMind Control Suite 基准测试和 2D 导航任务中表现优异。

Oct, 2022

在具有挑战性的环境中，将神经网络和树搜索结合用于任务和动作规划

利用深度神经网络和强化学习技术，结合蒙特卡罗方法和分层控制策略，解决了复杂动态环境下行车规划的问题，提出了一种用于道路自动驾驶的方案。该方案使用 LTL 约束条件和控制策略，训练神经网络，在规避交通事故、遵守交通规则的前提下，行驶到指定的终点。

Mar, 2017

分层蒙特卡洛树搜索的自动驾驶车辆分散协作规划

这篇论文介绍了一种基于蒙特卡洛树搜索的去中心化合作规划方法，通过使用宏操作来描述自动驾驶车辆在不同的环境中的合作规划，实现不同交通参与者之间的协调和显式建模。

Jul, 2018

经验引导的蒙特卡罗树搜索在反合成规划中的应用

本文提出了一种名为 MCTS 的基于模拟退火算法的反合成规划方法，使用 Experience Guidance Network 从化学合成经验中学习知识，实现有效处理拥有巨大可能性的化学反应，实验结果证明在效率和功效上均优于现有研究成果。

Dec, 2021