AAAIJul, 2020

自主飞行器基于深度强化学习的长期规划

TL;DR本文研究了基于现实生活中无人机赛事的长期规划场景,对使用 PPO 算法训练的强化学习智能体在无人机比赛中与使用传统路径规划算法的模拟无人机进行了实验,使用对手无人机的 GPS 信息作为专家指导进行训练,成功解决了复杂状态空间问题,其代码可以在我们的 GitHub 存储库中找到。