基于年龄的移动边缘计算调度:一种深度强化学习方法
移动边缘计算是一种有潜力的范式,用于实时应用程序,具有密集的计算需求(例如,自动驾驶),因为它可以减少处理延迟。本文关注计算密集型更新的及时性,通过信息时代(Age-of-Information)来衡量,并研究如何联合优化任务更新和离线策略以及分数形式的信息时代。我们提出了一个分数强化学习(RL)框架,并证明其收敛性。实验结果表明,与几个非分数基准相比,我们提出的算法将平均信息时代降低了高达 57.6%。
Dec, 2023
本篇论文提出了一种优化移动边缘计算系统中信息鲜度的算法,使用了多层次 MDP 和嵌套索引框架,并设计了一种带有可证明渐近最优性的嵌套索引策略,与基准相比,我们的算法优化间隙缩小了高达 40%,并且当系统纲量足够大时,渐进地逼近了下限。
Jul, 2023
研究了一种 UAV 辅助的无线网络,通过 Markov 决策过程和深度强化学习算法优化飞行轨迹和任务调度来最小化信息年龄值的加权和,取得了显著的研究成果。
May, 2019
本文研究了在曼哈顿网格车辆间通信网络中,基于信息年龄感知的无线电资源管理问题,通过马尔可夫决策过程的方法,使用长短时记忆模型和深度强化学习技术提出了一种去中心化的策略,实现每个车辆用户设备 - 对之间的最优消耗和信息更新。实证分析表明,所提出的算法能够显著地提高性能。
Aug, 2019
应用深度强化学习算法,联合设计无人机的轨迹,以最小化信息的年龄,从而确保基站中接收到的信息是尽可能新鲜和准确的。相比基准方案,该算法平均可降低 25%的信息年龄,并需要少至 50%的能量。
Sep, 2022
本文介绍了一种利用数据驱动的方案,优化联网车辆的驾驶路线,以保证信息时延的可信度,利用商用 LTE 网络测量车辆之间的连接延迟,建立连接车辆信息时延模型,在此基础上提出了一种基于 DQN 的算法来确定最优驾驶路线,结果表明该方法可以提高接口保持服务的 AoI 信心水平
Apr, 2020
本文研究了在车辆网络中如何通过最小化信息时代和发送功率消耗来提供及时更新,采用非正交多模式信息传播方法,利用混合深度 Q 网络和深度确定性策略梯度模型解决多目标优化问题,并提出了一个两阶段元多目标强化学习解决方案来估计 Pareto 前沿。
Feb, 2024
通过设计的多目标 (深度) 强化学习 (MORL) 资源调度方案,结合了近端策略优化 (PPO) 方法以解决多目标边缘计算系统下未知偏好的问题,本研究在能源消耗与传输延迟最小化的前提下,通过多边缘 MEC 系统中多目标离线问题进行建模与解决。
Jul, 2023
该研究探讨了一种去中心化的传输策略,通过利用传感器传输过程和网络拥塞对信息年龄(AoI)的影响,结合基于粒子滤波和强化学习的方法,实现了多代理间的协同最小化预期的 AoI。
Dec, 2023
提出一种称为 AoS 的信令更新语义新鲜度的度量方式,针对节点更新源和目的地之间的状态更新的最优控制策略进行研究,提出了在线和离线的深度演员 - 评论家算法,离线算法在数据集质量方面表现出强大的鲁棒性。
Sep, 2022