本文研究基于深度学习和强化学习的旅行商问题的新模型和架构,强调机器学习在解决组合优化问题方面的限制,并提出了一种新的度量标准ROD以回答两个基本问题。
Sep, 2019
本研究提出使用强化学习训练的图指针网络(Graph Pointer Networks,GPNs)来解决旅行商问题。我们使用GPNs对输入图进行嵌入并通过学习分层策略来优化城市排列。实验结果表明,GPNs对小规模的TSP50/100问题的泛化性能不错,且在TSP500/1000问题中获得了更短的旅行路径和更快的计算时间,同时当问题涉及时间窗口约束时,支持最优解的分层强化学习训练优于以往的基准方法。
Nov, 2019
本论文使用基于深度加强学习方法的策略梯度算法,通过2-opt操作符学习本地搜索启发式,提出了一种可以轻松扩展到更一般k-opt移动的策略神经网络,实验结果表明,所学习的策略比之前的具有最先进性能的深度学习方法更快接近最优解。
Apr, 2020
本文介绍一种使用强化学习训练图神经网络求解单人游戏定义的图组合优化问题的新框架,可以处理最小生成树、最短路径、旅行商问题和车辆路径问题等一系列问题,该方法可在线性运行时间内输出近似解,并且能够推广到多种情况,包括NP困难的问题和真实世界的图。
Jun, 2020
本文利用强化学习和 Transformer 结构设计了用于 Traveling Salesman Problem 的新型算法,相较于以往的算法在 TSP50 和 TSP100 上有了更好的表现
Mar, 2021
本文研究如何将深度强化学习和图神经网络应用于无线网络中的电力和信道分配问题,研究结果表明现有结构还不能很好地识别图的结构和特征,并且对于对图产生影响的问题不太适用,但研究还是取得了一些积极进展,比如通过距离编码来增强问题的表示方法。
Jan, 2022
本研究针对组合优化问题,提出了在深度学习模型训练前进行预训练以利用相关算法对于解决TSP问题具有提升作用的算法推理方法,并证明该方法能够优于传统深度学习模型。
May, 2023
深度神经网络和强化学习方法在解决复杂的组合问题方面取得了显著的实证成果,本文引入了一种新的理论框架来分析这些方法的有效性,回答了存在生成模型能够生成近似最优解、拥有易处理的参数数量以及优化结果无次优静态点等问题,并介绍了一种新的正则化过程,实验证明其有助于解决梯度消失和避免不良静态点的问题。
Oct, 2023
通过结合行为克隆和增强学习方法,本文简化了端到端的神经组合优化训练过程,采用随机抽样解决方案并利用概率策略改进来提高模型性能,在旅行推销员问题和车辆路径问题方面取得了令人满意的结果,并应用于作业车间调度问题,超越现有的方法。
Mar, 2024
大规模神经组合优化模型的实例条件适应模型(ICAM)和基于强化学习的训练方案可在不同规模下解决旅行商问题(TSP)并实现最佳性能。
May, 2024