Jun, 2024

基于多智能体强化学习的可重构智能表面辅助 VEC

TL;DR车辆边缘计算通过执行本地任务或将任务卸载到附近边缘设备来实现高强度任务处理,而可重构智能表面则通过灵活调整相位来提供替代通信路径。本文提出了一个新的深度强化学习框架,结合修改后的多智能体深度确定性策略梯度(MADDPG)方法和块坐标下降(BCD)算法,用于优化车辆用户(VUs)的功率分配和可重构智能表面的相位调整,在模拟结果中表现出优于集中式深度确定性策略梯度(DDPG)方案和随机方案的性能。