通过分层深度强化学习实现虚拟网络嵌入的联合接纳控制和资源分配

Jun, 2024

通过分层深度强化学习实现虚拟网络嵌入的联合接纳控制和资源分配

Joint Admission Control and Resource Allocation of Virtual Network Embedding via Hierarchical Deep Reinforcement Learning

PDF

Tianfu Wang, Li Shen, Qilin Fan, Tong Xu, Tongliang Liu...

TL;DR本文提出了一种深度分层强化学习方法，命名为 HRL-ACRA，用于解决虚拟网络嵌入中的综合接纳控制和资源分配问题。通过分解 VNE 过程为上层策略和下层策略，考虑到无限时间问题和奖励稀疏问题，采用了平均奖励方法和自定义多目标内在奖励。同时，利用深度特征感知图神经网络和序列到序列模型，能够更好地获取 VNR 和物理网络的特征，并生成嵌入行动。实验证明 HRL-ACRA 在接纳率和长期平均收入方面优于现有基线算法。

Abstract

As an essential resource management problem in network virtualization, virtual network embedding (VNE) aims to allocate the finite resources of physical network to sequentially arriving virtual network requests (VNRs) with different resource demands. Since this is an NP-hard combinator

virtual network embedding resource allocation admission control reinforcement learning deep feature-aware graph neural network

发现论文，激发创造

基于图卷积神经网络和强化学习的动态虚拟网络嵌入算法

本文提出了一种基于强化学习和图卷积神经网络的动态虚拟网络嵌入算法，将自定义的适应度矩阵和适应值作为目标函数，实现了高效的动态虚拟网络嵌入，有效降低了资源碎片化程度，并验证了该算法具有优秀的灵活性和基本 VNE 特性。

Feb, 2022

基于强化学习的安全感知虚拟网络嵌入算法

提出一种基于强化学习的安全感知虚拟网络嵌入算法，采用策略网络作为学习代理并在训练阶段使用子节点属性提取为特征矩阵，该算法在安全性、收益和虚拟网络请求接受率等方面表现优于典型方法。

Feb, 2022

FlagVNE: 网络资源分配的灵活且可普适的强化学习框架

在本研究中，我们提出了一种名为 FlagVNE 的灵活且具有普适性的虚拟网络嵌入的强化学习框架，通过设计双向基于动作的马尔可夫决策过程模型，使用层次解码器来生成自适应的动作概率分布，并采用元强化学习的训练方法和课程计划策略来解决动作空间扩展和泛化问题，进而提高解决方案空间的探索灵活性和训练效率，实验证明了 FlagVNE 在多个关键指标上的有效性。

Apr, 2024

猴子生意：强化学习遇到邻域搜索用于虚拟网络嵌入

本文提出了一种新的虚拟网络嵌入算法 NEPA，该算法与 NRPA 和邻域搜索相结合，通过 “猴子式” 的跳跃方式学习并改进嵌入决策，并在真实和合成拓扑上取得比其他同类算法更好的结果。

Feb, 2022

面向成本和时延敏感的虚拟网络功能部署和路由的多智能体深度强化学习

本文提出了一种基于多智能体深度强化学习的有效而新颖的方法，用于解决联合虚拟网络功能（VNF）部署和路由问题，该问题涉及多个不同需求的服务请求同时交付，并通过其延迟和成本敏感因素反映服务请求的不同需求，提出了基于参数移植的模型重新训练方法来处理网络拓扑发生更改的情况。

Jun, 2022

基于深度强化学习和图神经网络的光可组合数据中心网络感知计算和内存分配

采用深度强化学习方法，通过图神经网络模型实现网络资源的分配，该方法比现有的最佳启发式算法达到更高的接受率；即使在未适当训练的情况下，可以在规模比训练时大 $10^2$ 倍的数据中心网络中保持高性能。

Oct, 2022

面向下一代 HetNets 的多层次多智能体 DRL 框架：联合多 RAT 分配和动态资源分配

本文提出了一个基于分阶段多代理深度强化学习框架 DeepRAT 来解决下一代异构无线网络中成本感知的下行总速率最大化的问题。通过模拟实现，我们证明各种 DRL 代理的有效互动，学习系统动态并导出全局最优策略，同时也证明了 DeepRAT 算法在网络效用方面优于现有的最先进的启发式方法，并进一步量化了 DeepRAT 模型在快速适应网络动态、例如设备的移动方面的能力。

Feb, 2022

动态车联网中的 DNN 划分、任务卸载和资源分配：一种基于 Lyapunov 导引的扩散强化学习方法

人工智能和深度神经网络在车辆网络生态系统中的快速发展引入了计算密集型任务，对单个车辆的计算资源需求超过其能力，为解决这一挑战，车辆边缘计算作为一个解决方案应运而生，通过车辆间 / 基础设施之间的通信资源池提供深度神经网络任务的计算服务，本文将 VEC 中的 DNN 划分、任务卸载和资源分配问题建模为动态长期优化问题，目标是在时间上保证系统稳定的同时尽量减少 DNN 任务的完成时间，首先利用 Lyapunov 优化技术将原始的长期优化问题与稳定约束解耦成每个时隙的确定性问题，然后提出了一种基于 Multi-Agent Diffusion-based Deep Reinforcement Learning (MAD2RL) 算法，通过创新性地使用扩散模型来确定最优的 DNN 划分和任务卸载决策，在 MAD2RL 中还将凸优化技术作为子程序加以整合来分配计算资源，提高学习效率，通过对真实世界车辆移动轨迹的模拟，我们证明了我们所提出的算法相对于现有的基准解决方案具有更优越的性能。

Jun, 2024

MEC 辅助下的智能混合资源分配在 RAN 切片网络中

通过考虑多节点计算资源的协作分配、传输资源块（RB）的分配以及系统的时变动态性，本文旨在通过联合考虑提出一种适用于合作 MEC 辅助的 RAN 切片系统中异构服务需求的最大 SSR 的方法。对系统进行抽象并使用循环图强化学习算法来智能地学习最佳混合 RA 策略，利用图神经网络（GCN）和深度确定性策略梯度（DDPG）有效地提取等效拓扑图的空间特征。此外，还设计了一种新的时间循环强化学习框架，将先前时刻策略网络的动作输出整合到后续时刻策略网络的状态输入中，以适应时变和上下文网络环境。此外，我们探讨了两种使用案例场景，以讨论所提出的 RGRL 算法的普遍优越性。仿真结果表明，所提出的算法在平均 SSR、性能稳定性和网络复杂性方面具有优势。

May, 2024

VN 网络：嵌入新出现的实体与虚拟邻居

通过引入逻辑规则和对称路径规则，我们提出了一种名为 Virtual Neighbor（VN）网络的新框架来解决嵌入方法中的邻居稀疏问题，该网络在两个知识图完成任务上明显优于现有方法，并且对邻居稀疏问题高度稳健。

Feb, 2024