在图上学习组合优化算法
本文提出了一种利用神经网络和强化学习解决组合优化问题的框架,特别关注旅行推销员问题和背包问题,证明了该方法在不需要太多工程和启发式设计的情况下在二维欧几里得图上取得接近最优结果,并且可以得到具有多达200个项目实例的最优解。
Nov, 2016
该研究提出了一种新的基于AlphaGo Zero的学习策略,将其与图嵌入和图神经网络相结合,解决了复杂的组合优化问题,同时取得了比相关方法更好的性能表现。
May, 2019
在解决复杂优化问题方面,探索式组合优化(ECO-DQN)通过连续改进解决方案,从而有效地学习有效的启发式方法来解决图上的组合优化问题,并在最大割问题上展示了最先进的强化学习性能。
Sep, 2019
本研究提出使用强化学习训练的图指针网络(Graph Pointer Networks,GPNs)来解决旅行商问题。我们使用GPNs对输入图进行嵌入并通过学习分层策略来优化城市排列。实验结果表明,GPNs对小规模的TSP50/100问题的泛化性能不错,且在TSP500/1000问题中获得了更短的旅行路径和更快的计算时间,同时当问题涉及时间窗口约束时,支持最优解的分层强化学习训练优于以往的基准方法。
Nov, 2019
本文介绍一种使用强化学习训练图神经网络求解单人游戏定义的图组合优化问题的新框架,可以处理最小生成树、最短路径、旅行商问题和车辆路径问题等一系列问题,该方法可在线性运行时间内输出近似解,并且能够推广到多种情况,包括NP困难的问题和真实世界的图。
Jun, 2020
利用图神经网络和深度Q学习的强化学习方法,针对组合优化问题提出了一种无需问题特定设计即可实现状态最优化策略搜索的通用模型,并在最大k-Cut问题和旅行商问题上实验验证了其优越性。
Feb, 2021
本文提出一种名为Graph Temporal Attention with Reinforcement Learning (GTA-RL)的新型框架,针对动态组合优化问题学习启发式解决方案。该框架结构包括一个能够嵌入组合问题实例的时间特征的编码器和一个能够动态聚焦于嵌入特征以找到所需组合问题实例的解码器,并针对实时版本组合优化问题进行了扩展。实验证明,与现有方法相比,该方法在动态和实时图组合优化方面具有更高的效率和优化求解器的有效性。
Jan, 2022
本研究提出了一种基于神经网络的无数据训练方法,用于解决组合优化问题,特别是最大独立集和最大团的问题,并提出了通用的图缩小过程来处理大规模图形。这种方法在无需数据的情况下,可与有监督学习、强化学习和基于机器学习的现有方法相媲美或更优,具有广泛的适用性。
Mar, 2022
本论文提出并证明了图神经网络可以应用于解决组合优化问题,通过将优化过程视为顺序决策问题,使用Q-Learning训练图神经网络可以在参数和训练时间上只占一小部分的情况下接近达到最先进的启发式求解器的性能。
Jan, 2024