Dec, 2020

基于分布式多智能体元学习的 无线无人机网络轨迹设计

TL;DR本研究采用基于价值分解的强化学习算法来解决能量限制多个无人机在动态无线网络环境下的航迹规划问题,以最大化无人机服务的用户群组覆盖率,并通过元学习机制优化算法的性能。仿真结果显示,该算法相较于基准多智能体算法,能够分别提高 53.2% 的服务覆盖率和 30.6% 的收敛速度,并且在面对之前未见过的任务时,元学习可提高算法的收敛速度高达 53.8%。