基于双层优化的图强化学习用于网络控制

May, 2023

基于双层优化的图强化学习用于网络控制

Graph Reinforcement Learning for Network Control via Bi-Level Optimization

Daniele Gammelli, James Harrison, Kaidi Yang, Marco Pavone, Filipe Rodrigues...

TL;DR本篇论文提出了一种基于增强学习和图网络的框架来处理优化问题，避免了传统基于优化方法规模不可扩展、启发式算法设计需要大量人工试错等问题，使得算法更加高效和可扩展。作者在真实控制问题中的实验进一步表明了这种方法的优越性。

Abstract

optimization problems over dynamic networks have been extensively studied and widely used in the past decades to formulate numerous real-world problems. However, (1) traditional →

发现论文，激发创造

在图上学习组合优化算法

本文介绍了结合强化学习和图嵌入的方法，使用元算法来解决NP-hard组合优化问题和图上的最小点集覆盖、最大割和旅行商问题等优化问题。

Apr, 2017

扩展版AlphaGo Zero在图上解决NP难题

该研究提出了一种新的基于AlphaGo Zero的学习策略，将其与图嵌入和图神经网络相结合，解决了复杂的组合优化问题，同时取得了比相关方法更好的性能表现。

May, 2019

图形指针网络和层次强化学习的组合优化

本研究提出使用强化学习训练的图指针网络（Graph Pointer Networks，GPNs）来解决旅行商问题。我们使用GPNs对输入图进行嵌入并通过学习分层策略来优化城市排列。实验结果表明，GPNs对小规模的TSP50/100问题的泛化性能不错，且在TSP500/1000问题中获得了更短的旅行路径和更快的计算时间，同时当问题涉及时间窗口约束时，支持最优解的分层强化学习训练优于以往的基准方法。

Nov, 2019

线性时间内学习在实际图中求解组合优化问题

本文介绍一种使用强化学习训练图神经网络求解单人游戏定义的图组合优化问题的新框架，可以处理最小生成树、最短路径、旅行商问题和车辆路径问题等一系列问题，该方法可在线性运行时间内输出近似解，并且能够推广到多种情况，包括NP困难的问题和真实世界的图。

Jun, 2020

GraphOpt: 学习图形构建的优化模型

GraphOpt是一种结构形成的图形优化框架，采用最大熵反强化学习算法以及具有可扩展性的连续潜在行动空间，学习隐含的图形目标函数来解释所观察到的图形属性，并在未经训练的情况下实现竞争性链接预测性能。

Jul, 2020

使用多头注意力深度强化学习解决动态图问题

本文提出一种名为Graph Temporal Attention with Reinforcement Learning (GTA-RL)的新型框架，针对动态组合优化问题学习启发式解决方案。该框架结构包括一个能够嵌入组合问题实例的时间特征的编码器和一个能够动态聚焦于嵌入特征以找到所需组合问题实例的解码器，并针对实时版本组合优化问题进行了扩展。实验证明，与现有方法相比，该方法在动态和实时图组合优化方面具有更高的效率和优化求解器的有效性。

Jan, 2022

基于深度强化学习的网络拓扑优化

本研究提出了一种新颖的深度强化学习算法，称为优势演员评论-图搜索（A2C-GS），用于网络拓扑优化，并通过在真实网络场景上进行案例研究，证明了A2C-GS在效率和性能方面具有卓越的性能。

Apr, 2022

支持向量机中节点选择的强化学习

使用一种新颖的双模拟技术，通过强化学习模型从整个树状态中选择节点，借助图神经网络生成基于路径的概率分布，将节点选择建模为概率分布，训练模型以实现高质量的节点选择策略，并在严格时间约束下，在多个基准测试中显示出显著的性能改进。

Sep, 2023

通过自适应图形的无线网络中的多智能体强化学习功率控制

无线网络中的动态优化策略是一个重要的研究领域，本文提出了一种使用图神经网络的方法，将分布式代理之间的动态相互作用建模，并在网络优化问题中实现了较好的泛化能力验证

Nov, 2023

组合优化的图强化学习：调查与统一视角

图离散结构上关于决策制定方法的综合视角，通过采用强化学习算法解决图优化问题。

Apr, 2024