Nov, 2023

多时间尺度控制和通信与深度强化学习 -- 第一部分:通信感知车辆控制

TL;DR一种基于深度强化学习的多时间尺度控制和通信的联合优化框架被提出,以车队控制(PC)为示例应用。为了改善 PC 在随机观察延迟下的性能,采用了细粒度嵌入式模拟 C-V2X 通信生成的延迟环境进行训练,并与基线 DRL 算法的性能进行比较。