Jan, 2024

基于协作强化学习的无人机(UAV)三维轨迹设计及跟踪

TL;DR本文研究使用一个主动无人机和四个被动无人机实时定位一个三维目标无人机的问题,并提出了基于 Z 函数分解的强化学习方法,通过优化无人机的轨迹和主动无人机的发送功率,以最大化目标无人机的定位精度。仿真结果表明,所提出的 ZD-RL 方法相对于 VD-RL 和独立深度 RL 方法,可以减小定位误差多达 39.4% 和 64.6%。