Jul, 2023

协作边缘计算系统中的联合服务缓存、通信和计算资源分配:基于深度强化学习的双时间尺度方法

TL;DR通过多维资源的资源共享、服务缓存、深度强化学习等方面的联合优化,我们提出了一种协同多接入边缘计算(MEC)框架,旨在最大化长期的服务质量(QoS)并降低缓存切换成本。通过改进的遗传算法(GA)和基于长短期记忆网络的深度确定性策略梯度(LSTM-DDPG)组成的深度强化学习(DRL)的双时间尺度方案(DGL-DDPG),我们将优化问题转化为马尔可夫决策过程(MDP),以实现大时间尺度上的服务缓存决策。仿真结果表明,我们提出的算法在平均 QoS 和缓存切换成本方面优于基准算法。