组合优化的图强化学习:调查与统一视角
该研究提出了一种新的基于AlphaGo Zero的学习策略,将其与图嵌入和图神经网络相结合,解决了复杂的组合优化问题,同时取得了比相关方法更好的性能表现。
May, 2019
介绍了解决图上组合优化问题的现有方法存在的问题,调查了与计算复杂性相关的机器学习研究的发展,并组织和比较了解决组合优化问题的学习结构。
May, 2020
本文介绍一种使用强化学习训练图神经网络求解单人游戏定义的图组合优化问题的新框架,可以处理最小生成树、最短路径、旅行商问题和车辆路径问题等一系列问题,该方法可在线性运行时间内输出近似解,并且能够推广到多种情况,包括NP困难的问题和真实世界的图。
Jun, 2020
利用图神经网络和深度Q学习的强化学习方法,针对组合优化问题提出了一种无需问题特定设计即可实现状态最优化策略搜索的通用模型,并在最大k-Cut问题和旅行商问题上实验验证了其优越性。
Feb, 2021
本研究提出了一种基于神经网络的无数据训练方法,用于解决组合优化问题,特别是最大独立集和最大团的问题,并提出了通用的图缩小过程来处理大规模图形。这种方法在无需数据的情况下,可与有监督学习、强化学习和基于机器学习的现有方法相媲美或更优,具有广泛的适用性。
Mar, 2022
本文介绍了一种名为ECORD的新型强化学习算法,它通过限制图神经网络的使用,提升了在最大割问题上的表现和可扩展性。在500个节点的图上,ECORD相较于最接近的竞争者,优化效果缩小了最多73%。同时,ECORD在具有多达10000个节点的图的普适性方面保持了强有力的表现。
May, 2022
本文提出一种基于强化学习的方法用于解决组合优化中的数据标记和推理延迟问题,并使用蒙特卡罗树搜索和价值网络提高策略网络的性能表现。作者在四种不同类别的组合优化问题上进行了评估,结果表明该方法相较于现有机器学习和启发式方法有更优的性能表现。
Jun, 2022
本篇论文提出了一种基于增强学习和图网络的框架来处理优化问题,避免了传统基于优化方法规模不可扩展、启发式算法设计需要大量人工试错等问题,使得算法更加高效和可扩展。作者在真实控制问题中的实验进一步表明了这种方法的优越性。
May, 2023
本论文提出并证明了图神经网络可以应用于解决组合优化问题,通过将优化过程视为顺序决策问题,使用Q-Learning训练图神经网络可以在参数和训练时间上只占一小部分的情况下接近达到最先进的启发式求解器的性能。
Jan, 2024