Jun, 2024

通过分层深度强化学习实现虚拟网络嵌入的联合接纳控制和资源分配

TL;DR本文提出了一种深度分层强化学习方法,命名为 HRL-ACRA,用于解决虚拟网络嵌入中的综合接纳控制和资源分配问题。通过分解 VNE 过程为上层策略和下层策略,考虑到无限时间问题和奖励稀疏问题,采用了平均奖励方法和自定义多目标内在奖励。同时,利用深度特征感知图神经网络和序列到序列模型,能够更好地获取 VNR 和物理网络的特征,并生成嵌入行动。实验证明 HRL-ACRA 在接纳率和长期平均收入方面优于现有基线算法。