Feb, 2024

车联网中的非正交年龄最优信息传播:一个基于元多目标强化学习的方法

TL;DR本文研究了在车辆网络中如何通过最小化信息时代和发送功率消耗来提供及时更新,采用非正交多模式信息传播方法,利用混合深度 Q 网络和深度确定性策略梯度模型解决多目标优化问题,并提出了一个两阶段元多目标强化学习解决方案来估计 Pareto 前沿。