基于深度强化学习的无人机辅助网络中最小化信息时延的方法

May, 2019

基于深度强化学习的无人机辅助网络中最小化信息时延的方法

Deep Reinforcement Learning for Minimizing Age-of-Information in UAV-assisted Networks

Mohamed A. Abd-Elmagid, Aidin Ferdowsi, Harpreet S. Dhillon, Walid Saad

TL;DR研究了一种 UAV 辅助的无线网络，通过 Markov 决策过程和深度强化学习算法优化飞行轨迹和任务调度来最小化信息年龄值的加权和，取得了显著的研究成果。

Abstract

unmanned aerial vehicles (UAVs) are expected to be a key component of the next-generation wireless systems. Due to their deployment flexibility, UAVs are being considered as an efficient solution for collecting information data from ground nodes and transmitting it wirelessly to the ne

unmanned aerial vehicles uav-assisted wireless network age-of-information markov decision process deep reinforcement learning

发现论文，激发创造

基于学习的多个无人机轨迹规划，以最小化 IoT 网络中的 AoI

应用深度强化学习算法，联合设计无人机的轨迹，以最小化信息的年龄，从而确保基站中接收到的信息是尽可能新鲜和准确的。相比基准方案，该算法平均可降低 25％的信息年龄，并需要少至 50％的能量。

Sep, 2022

利用空中可重构智能表面优化信息时效的深度强化学习方法

本篇研究探讨将无人机和可重构智能表面元素与物联网设备集成以被动中继信息的好处，并通过优化问题来最小化平均信息时效，并且使用近端策略优化算法来解决混合整数非凸优化问题，结果表明我们的算法在 AoI 方面优于其他所有算法。

Nov, 2020

基于深度强化学习的无人机无线数据采集路径规划

该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据，以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制，从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束，在各种场景参数下做出运动决策。

Jul, 2020

使用集成深度神经网络在无人机辅助网络中最小化信息年龄

该论文研究了在无人机辅助网络中的信息时代（Age-of-Information，AoI）问题，并通过优化无人机的停止位置和设备选择概率来最小化设备之间的平均 AoI。为了解决这个问题，论文首先推导了一个包括设备选择概率的平均 AoI 的闭合形式表达式。然后，将该问题建模为一个带有服务质量约束的非凸最小化问题。由于该问题难以求解，论文提出了一种基于集成深度神经网络（Ensemble Deep Neural Network，EDNN）的方法，该方法利用了所研究问题的双重形式化。具体而言，集成中的深度神经网络（Deep Neural Networks，DNNs）通过使用所研究问题的 Lagrangian 函数进行无监督方式的训练。实验结果表明，所提出的 EDNN 方法在减少平均 AoI 方面优于传统的 DNN 方法，实现了 29.5% 的显著降低。

Sep, 2023

通过无人机群体进行大规模物联网中的年龄最小化：一种多智能体增强学习方法

应用多智能体深度强化学习来解决大型物联网场景中的高维问题，通过部署一群无人机 (UAV swarm) 为物联网网络提供覆盖，并最小化信息时效，结果表明合作和部分合作的多智能体深度强化学习方法能够优于复杂度高的集中式深度强化学习方法。

Sep, 2023

马尔可夫物联网模型中的交通学习和主动型无人机轨迹规划与数据上行

通过学习的基于马尔可夫事件的新颖框架，利用无人机作为飞行基站，预测 IoT 设备的流量到达并优化多个无人机的轨迹和调度策略，最终通过深度强化学习方法改进传输性能。

Jan, 2024

车联网中的非正交年龄最优信息传播：一个基于元多目标强化学习的方法

本文研究了在车辆网络中如何通过最小化信息时代和发送功率消耗来提供及时更新，采用非正交多模式信息传播方法，利用混合深度 Q 网络和深度确定性策略梯度模型解决多目标优化问题，并提出了一个两阶段元多目标强化学习解决方案来估计 Pareto 前沿。

Feb, 2024

智能汽车网络中基于信息时代的无线资源管理：一种主动的深度强化学习视角

本文研究了在曼哈顿网格车辆间通信网络中，基于信息年龄感知的无线电资源管理问题，通过马尔可夫决策过程的方法，使用长短时记忆模型和深度强化学习技术提出了一种去中心化的策略，实现每个车辆用户设备 - 对之间的最优消耗和信息更新。实证分析表明，所提出的算法能够显著地提高性能。

Aug, 2019

基于年龄的移动边缘计算调度：一种深度强化学习方法

移动边缘计算在实时应用中对信息时效性的重要性提出了新的理解与优化方法，基于马尔可夫决策过程和深度强化学习，将偏知识利用与系统动态建模相结合的算法应用于此问题研究，结果表明算法在多种场景下优于其他基准算法。

Dec, 2023

基于深度强化学习的无人机三维轨迹与数据采集优化

本文旨在通过设计并运用基于最短路径的无人机来提升物联网设备数据的收集和资源分配。同时，设计了一个基于深度强化学习的技术来获取特定区域内的最优轨迹和吞吐量，从而实现了无人机自主收集所有数据的目标，而且显著提高了总速率，最小化了关联资源的使用。实验结果证实了方案在效率、轨迹、时间等方面的优势。

Jun, 2021