扩展版AlphaGo Zero在图上解决NP难题
文章提出一种基于深度学习和启发式算法的图卷积网络方法,用于解决某些NP困难问题,并在四个NP困难问题和五个数据集上进行了评估,结果表明该方法在某些NP困难问题上已经达到了高度优化的最新启发式算法的水平,并具有较强的泛化性和扩展性。
Oct, 2018
在解决复杂优化问题方面,探索式组合优化(ECO-DQN)通过连续改进解决方案,从而有效地学习有效的启发式方法来解决图上的组合优化问题,并在最大割问题上展示了最先进的强化学习性能。
Sep, 2019
本研究提出使用强化学习训练的图指针网络(Graph Pointer Networks,GPNs)来解决旅行商问题。我们使用GPNs对输入图进行嵌入并通过学习分层策略来优化城市排列。实验结果表明,GPNs对小规模的TSP50/100问题的泛化性能不错,且在TSP500/1000问题中获得了更短的旅行路径和更快的计算时间,同时当问题涉及时间窗口约束时,支持最优解的分层强化学习训练优于以往的基准方法。
Nov, 2019
本文介绍一种使用强化学习训练图神经网络求解单人游戏定义的图组合优化问题的新框架,可以处理最小生成树、最短路径、旅行商问题和车辆路径问题等一系列问题,该方法可在线性运行时间内输出近似解,并且能够推广到多种情况,包括NP困难的问题和真实世界的图。
Jun, 2020
本研究提出了一种基于神经网络的无数据训练方法,用于解决组合优化问题,特别是最大独立集和最大团的问题,并提出了通用的图缩小过程来处理大规模图形。这种方法在无需数据的情况下,可与有监督学习、强化学习和基于机器学习的现有方法相媲美或更优,具有广泛的适用性。
Mar, 2022
本文利用蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS)算法创造了自主智能体,学习玩Snake游戏,该游戏可被公式化为单人折扣马尔可夫决策过程,问题困难度大,但与先前工作相比,该算法是首个实现胜率超过 $0.5$ 的算法,可应用于解决复杂的NP困难问题。
Nov, 2022
本论文提出并证明了图神经网络可以应用于解决组合优化问题,通过将优化过程视为顺序决策问题,使用Q-Learning训练图神经网络可以在参数和训练时间上只占一小部分的情况下接近达到最先进的启发式求解器的性能。
Jan, 2024