基于年龄的移动边缘计算调度：一种深度强化学习方法

Dec, 2023

基于年龄的移动边缘计算调度：一种深度强化学习方法

Age-Based Scheduling for Mobile Edge Computing: A Deep Reinforcement Learning Approach

Xingqiu He, Chaoqun You, Tony Q. S. Quek

TL;DR移动边缘计算在实时应用中对信息时效性的重要性提出了新的理解与优化方法，基于马尔可夫决策过程和深度强化学习，将偏知识利用与系统动态建模相结合的算法应用于此问题研究，结果表明算法在多种场景下优于其他基准算法。

Abstract

With the rapid development of mobile edge computing (MEC), various real-time applications have been deployed to benefit people's daily lives. The performance of these applications relies heavily on the freshness of collected environmental information, which can be quantified by its

mobile edge computing real-time applications age of information markov decision process reinforcement learning

发现论文，激发创造

分数深度强化学习用于年龄最小化的移动边缘计算

移动边缘计算是一种有潜力的范式，用于实时应用程序，具有密集的计算需求（例如，自动驾驶），因为它可以减少处理延迟。本文关注计算密集型更新的及时性，通过信息时代（Age-of-Information）来衡量，并研究如何联合优化任务更新和离线策略以及分数形式的信息时代。我们提出了一个分数强化学习（RL）框架，并证明其收敛性。实验结果表明，与几个非分数基准相比，我们提出的算法将平均信息时代降低了高达 57.6％。

Dec, 2023

移动边缘计算系统中最小化信息时延的嵌套索引方法

本篇论文提出了一种优化移动边缘计算系统中信息鲜度的算法，使用了多层次 MDP 和嵌套索引框架，并设计了一种带有可证明渐近最优性的嵌套索引策略，与基准相比，我们的算法优化间隙缩小了高达 40％，并且当系统纲量足够大时，渐进地逼近了下限。

Jul, 2023

基于深度强化学习的无人机辅助网络中最小化信息时延的方法

研究了一种 UAV 辅助的无线网络，通过 Markov 决策过程和深度强化学习算法优化飞行轨迹和任务调度来最小化信息年龄值的加权和，取得了显著的研究成果。

May, 2019

智能汽车网络中基于信息时代的无线资源管理：一种主动的深度强化学习视角

本文研究了在曼哈顿网格车辆间通信网络中，基于信息年龄感知的无线电资源管理问题，通过马尔可夫决策过程的方法，使用长短时记忆模型和深度强化学习技术提出了一种去中心化的策略，实现每个车辆用户设备 - 对之间的最优消耗和信息更新。实证分析表明，所提出的算法能够显著地提高性能。

Aug, 2019

基于学习的多个无人机轨迹规划，以最小化 IoT 网络中的 AoI

应用深度强化学习算法，联合设计无人机的轨迹，以最小化信息的年龄，从而确保基站中接收到的信息是尽可能新鲜和准确的。相比基准方案，该算法平均可降低 25％的信息年龄，并需要少至 50％的能量。

Sep, 2022

利用深度 Q 学习最小化支持雾计算的车联网信息时代

本文介绍了一种利用数据驱动的方案，优化联网车辆的驾驶路线，以保证信息时延的可信度，利用商用 LTE 网络测量车辆之间的连接延迟，建立连接车辆信息时延模型，在此基础上提出了一种基于 DQN 的算法来确定最优驾驶路线，结果表明该方法可以提高接口保持服务的 AoI 信心水平

Apr, 2020

车联网中的非正交年龄最优信息传播：一个基于元多目标强化学习的方法

本文研究了在车辆网络中如何通过最小化信息时代和发送功率消耗来提供及时更新，采用非正交多模式信息传播方法，利用混合深度 Q 网络和深度确定性策略梯度模型解决多目标优化问题，并提出了一个两阶段元多目标强化学习解决方案来估计 Pareto 前沿。

Feb, 2024

多目标深度强化学习用于移动边缘计算

通过设计的多目标 (深度) 强化学习 (MORL) 资源调度方案，结合了近端策略优化 (PPO) 方法以解决多目标边缘计算系统下未知偏好的问题，本研究在能源消耗与传输延迟最小化的前提下，通过多边缘 MEC 系统中多目标离线问题进行建模与解决。

Jul, 2023

部分可观测状况下的信息时代协同优化

该研究探讨了一种去中心化的传输策略，通过利用传感器传输过程和网络拥塞对信息年龄（AoI）的影响，结合基于粒子滤波和强化学习的方法，实现了多代理间的协同最小化预期的 AoI。

Dec, 2023

合作通信的语义时代：通过离线强化学习加速模拟以接近真实

提出一种称为 AoS 的信令更新语义新鲜度的度量方式，针对节点更新源和目的地之间的状态更新的最优控制策略进行研究，提出了在线和离线的深度演员 - 评论家算法，离线算法在数据集质量方面表现出强大的鲁棒性。

Sep, 2022