本文介绍了结合强化学习和图嵌入的方法,使用元算法来解决NP-hard组合优化问题和图上的最小点集覆盖、最大割和旅行商问题等优化问题。
Apr, 2017
该研究提出了一种新的基于AlphaGo Zero的学习策略,将其与图嵌入和图神经网络相结合,解决了复杂的组合优化问题,同时取得了比相关方法更好的性能表现。
May, 2019
本研究提出使用强化学习训练的图指针网络(Graph Pointer Networks,GPNs)来解决旅行商问题。我们使用GPNs对输入图进行嵌入并通过学习分层策略来优化城市排列。实验结果表明,GPNs对小规模的TSP50/100问题的泛化性能不错,且在TSP500/1000问题中获得了更短的旅行路径和更快的计算时间,同时当问题涉及时间窗口约束时,支持最优解的分层强化学习训练优于以往的基准方法。
Nov, 2019
本文介绍一种使用强化学习训练图神经网络求解单人游戏定义的图组合优化问题的新框架,可以处理最小生成树、最短路径、旅行商问题和车辆路径问题等一系列问题,该方法可在线性运行时间内输出近似解,并且能够推广到多种情况,包括NP困难的问题和真实世界的图。
Jun, 2020
GraphOpt是一种结构形成的图形优化框架,采用最大熵反强化学习算法以及具有可扩展性的连续潜在行动空间,学习隐含的图形目标函数来解释所观察到的图形属性,并在未经训练的情况下实现竞争性链接预测性能。
Jul, 2020
本文提出一种名为Graph Temporal Attention with Reinforcement Learning (GTA-RL)的新型框架,针对动态组合优化问题学习启发式解决方案。该框架结构包括一个能够嵌入组合问题实例的时间特征的编码器和一个能够动态聚焦于嵌入特征以找到所需组合问题实例的解码器,并针对实时版本组合优化问题进行了扩展。实验证明,与现有方法相比,该方法在动态和实时图组合优化方面具有更高的效率和优化求解器的有效性。
Jan, 2022
本研究提出了一种新颖的深度强化学习算法,称为优势演员评论-图搜索(A2C-GS),用于网络拓扑优化,并通过在真实网络场景上进行案例研究,证明了A2C-GS在效率和性能方面具有卓越的性能。
Apr, 2022
使用一种新颖的双模拟技术,通过强化学习模型从整个树状态中选择节点,借助图神经网络生成基于路径的概率分布,将节点选择建模为概率分布,训练模型以实现高质量的节点选择策略,并在严格时间约束下,在多个基准测试中显示出显著的性能改进。
Sep, 2023
无线网络中的动态优化策略是一个重要的研究领域,本文提出了一种使用图神经网络的方法,将分布式代理之间的动态相互作用建模,并在网络优化问题中实现了较好的泛化能力验证
Nov, 2023
图离散结构上关于决策制定方法的综合视角,通过采用强化学习算法解决图优化问题。
Apr, 2024