May, 2019

基于深度强化学习的无人机辅助网络中最小化信息时延的方法

TL;DR研究了一种 UAV 辅助的无线网络,通过 Markov 决策过程和深度强化学习算法优化飞行轨迹和任务调度来最小化信息年龄值的加权和,取得了显著的研究成果。