扩展版AlphaGo Zero在图上解决NP难题

May, 2019

扩展版AlphaGo Zero在图上解决NP难题

Solving NP-Hard Problems on Graphs by Reinforcement Learning without Domain Knowledge

Kenshin Abe, Zijian Xu, Issei Sato, Masashi Sugiyama

TL;DR该研究提出了一种新的基于AlphaGo Zero的学习策略，将其与图嵌入和图神经网络相结合，解决了复杂的组合优化问题，同时取得了比相关方法更好的性能表现。

Abstract

We propose an algorithm based on reinforcement learning for solving NP-hard problems on graphs. We combine Graph Isomorphism Networks and the Monte-Carlo Tree Search, which was originally used for game searches, for solving combinatorial optimization on graphs. Similarly to AlphaGo Zer

发现论文，激发创造

在图上学习组合优化算法

本文介绍了结合强化学习和图嵌入的方法，使用元算法来解决NP-hard组合优化问题和图上的最小点集覆盖、最大割和旅行商问题等优化问题。

Apr, 2017

图卷积网络与引导树搜索的组合优化

文章提出一种基于深度学习和启发式算法的图卷积网络方法，用于解决某些NP困难问题，并在四个NP困难问题和五个数据集上进行了评估，结果表明该方法在某些NP困难问题上已经达到了高度优化的最新启发式算法的水平，并具有较强的泛化性和扩展性。

Oct, 2018

强化学习的组合探索优化

在解决复杂优化问题方面，探索式组合优化（ECO-DQN）通过连续改进解决方案，从而有效地学习有效的启发式方法来解决图上的组合优化问题，并在最大割问题上展示了最先进的强化学习性能。

Sep, 2019

图形指针网络和层次强化学习的组合优化

本研究提出使用强化学习训练的图指针网络（Graph Pointer Networks，GPNs）来解决旅行商问题。我们使用GPNs对输入图进行嵌入并通过学习分层策略来优化城市排列。实验结果表明，GPNs对小规模的TSP50/100问题的泛化性能不错，且在TSP500/1000问题中获得了更短的旅行路径和更快的计算时间，同时当问题涉及时间窗口约束时，支持最优解的分层强化学习训练优于以往的基准方法。

Nov, 2019

线性时间内学习在实际图中求解组合优化问题

本文介绍一种使用强化学习训练图神经网络求解单人游戏定义的图组合优化问题的新框架，可以处理最小生成树、最短路径、旅行商问题和车辆路径问题等一系列问题，该方法可在线性运行时间内输出近似解，并且能够推广到多种情况，包括NP困难的问题和真实世界的图。

Jun, 2020

深度学习在组合优化树搜索中的问题

本研究提出了一个开源基准套件，对最大独立集问题进行了深入分析，结果表明现有的机器学习算法未能学习最优解的结构，算法技术仍是获得有效解决方案的关键。

Jan, 2022

使用无数据神经网络的可微组合优化方法

本研究提出了一种基于神经网络的无数据训练方法，用于解决组合优化问题，特别是最大独立集和最大团的问题，并提出了通用的图缩小过程来处理大规模图形。这种方法在无需数据的情况下，可与有监督学习、强化学习和基于机器学习的现有方法相媲美或更优，具有广泛的适用性。

Mar, 2022

AlphaSnake: 非确定性NP-hard马尔科夫决策过程的策略迭代

本文利用蒙特卡罗树搜索（Monte Carlo Tree Search，MCTS）算法创造了自主智能体，学习玩Snake游戏，该游戏可被公式化为单人折扣马尔可夫决策过程，问题困难度大，但与先前工作相比，该算法是首个实现胜率超过 $0.5$ 的算法，可应用于解决复杂的NP困难问题。

Nov, 2022

图形 Q-Learning 用于组合优化

本论文提出并证明了图神经网络可以应用于解决组合优化问题，通过将优化过程视为顺序决策问题，使用Q-Learning训练图神经网络可以在参数和训练时间上只占一小部分的情况下接近达到最先进的启发式求解器的性能。

Jan, 2024

组合优化的图强化学习：调查与统一视角

图离散结构上关于决策制定方法的综合视角，通过采用强化学习算法解决图优化问题。

Apr, 2024