车联网中的非正交年龄最优信息传播：一个基于元多目标强化学习的方法

Feb, 2024

车联网中的非正交年龄最优信息传播：一个基于元多目标强化学习的方法

Non-orthogonal Age-Optimal Information Dissemination in Vehicular Networks: A Meta Multi-Objective Reinforcement Learning Approach

PDF

A. A. Habob, H. Tabassum, O. Waqar

TL;DR本文研究了在车辆网络中如何通过最小化信息时代和发送功率消耗来提供及时更新，采用非正交多模式信息传播方法，利用混合深度 Q 网络和深度确定性策略梯度模型解决多目标优化问题，并提出了一个两阶段元多目标强化学习解决方案来估计 Pareto 前沿。

Abstract

This paper considers minimizing the age-of-information (AoI) and transmit power consumption in a vehicular network, where a roadside unit (RSU) provides timely updates about a set of physical processes to vehicle

age-of-information transmit power consumption vehicular network multi-objective optimization reinforcement learning

发现论文，激发创造

智能汽车网络中基于信息时代的无线资源管理：一种主动的深度强化学习视角

本文研究了在曼哈顿网格车辆间通信网络中，基于信息年龄感知的无线电资源管理问题，通过马尔可夫决策过程的方法，使用长短时记忆模型和深度强化学习技术提出了一种去中心化的策略，实现每个车辆用户设备 - 对之间的最优消耗和信息更新。实证分析表明，所提出的算法能够显著地提高性能。

Aug, 2019

车联网中基于时延优化的信息动态单播 - 多播调度

该论文研究了如何通过使用深度强化学习等方法，优化决策，减少信息年龄和传输功率，实现在路边单元（RSU）向车辆提供物理过程的及时更新的车辆网络中，并通过仿真结果展示了 AoI 和功耗之间的有趣的权衡关系。

Sep, 2022

基于深度强化学习的无人机辅助网络中最小化信息时延的方法

研究了一种 UAV 辅助的无线网络，通过 Markov 决策过程和深度强化学习算法优化飞行轨迹和任务调度来最小化信息年龄值的加权和，取得了显著的研究成果。

May, 2019

基于强化学习的感知到达时延感知资源分配方法研究

提出了一种基于可重构智能表面的车联网网络方案，利用信息时代模型和负载传输概率模型来优化车辆与基础设施之间的时效和车辆之间的稳定性，通过软性演员 - 评论家算法以最小化信息时代和优先传输负载的方式，使用驻波状态下 AI-B 图方案控制车辆的资源分配和相移控制，仿真结果表明该算法在收敛速度、累积奖励、信息时代性能和负载传输概率等方面胜过其他算法。

Jun, 2024

超可靠低延迟车联网通信的主动学习方法

本文提出了一种面向车联网的信息时代感知传输功率和资源块分配技术，利用高斯过程回归方法实现在线无中央控制机制的网络动态学习，实时预测未来 AoI，最小化 AoI 超过阈值的概率，并取得了 50% 以上的效果提升。

Nov, 2019

利用空中可重构智能表面优化信息时效的深度强化学习方法

本篇研究探讨将无人机和可重构智能表面元素与物联网设备集成以被动中继信息的好处，并通过优化问题来最小化平均信息时效，并且使用近端策略优化算法来解决混合整数非凸优化问题，结果表明我们的算法在 AoI 方面优于其他所有算法。

Nov, 2020

利用深度 Q 学习最小化支持雾计算的车联网信息时代

本文介绍了一种利用数据驱动的方案，优化联网车辆的驾驶路线，以保证信息时延的可信度，利用商用 LTE 网络测量车辆之间的连接延迟，建立连接车辆信息时延模型，在此基础上提出了一种基于 DQN 的算法来确定最优驾驶路线，结果表明该方法可以提高接口保持服务的 AoI 信心水平

Apr, 2020

基于学习的多个无人机轨迹规划，以最小化 IoT 网络中的 AoI

应用深度强化学习算法，联合设计无人机的轨迹，以最小化信息的年龄，从而确保基站中接收到的信息是尽可能新鲜和准确的。相比基准方案，该算法平均可降低 25％的信息年龄，并需要少至 50％的能量。

Sep, 2022

使用集成深度神经网络在无人机辅助网络中最小化信息年龄

该论文研究了在无人机辅助网络中的信息时代（Age-of-Information，AoI）问题，并通过优化无人机的停止位置和设备选择概率来最小化设备之间的平均 AoI。为了解决这个问题，论文首先推导了一个包括设备选择概率的平均 AoI 的闭合形式表达式。然后，将该问题建模为一个带有服务质量约束的非凸最小化问题。由于该问题难以求解，论文提出了一种基于集成深度神经网络（Ensemble Deep Neural Network，EDNN）的方法，该方法利用了所研究问题的双重形式化。具体而言，集成中的深度神经网络（Deep Neural Networks，DNNs）通过使用所研究问题的 Lagrangian 函数进行无监督方式的训练。实验结果表明，所提出的 EDNN 方法在减少平均 AoI 方面优于传统的 DNN 方法，实现了 29.5% 的显著降低。

Sep, 2023

基于年龄的移动边缘计算调度：一种深度强化学习方法

移动边缘计算在实时应用中对信息时效性的重要性提出了新的理解与优化方法，基于马尔可夫决策过程和深度强化学习，将偏知识利用与系统动态建模相结合的算法应用于此问题研究，结果表明算法在多种场景下优于其他基准算法。

Dec, 2023