Apr, 2023

AMS-DRL: 机载多目标逃逸安全导航的学习

TL;DR提出一种异步多阶段深度强化学习的方法(AMS-DRL)来训练对抗神经网络,以应对多个追赶者的攻击并快速适应其行为,确保无人机避免攻击并达到目标。该方法通过保证博弈论分析中的纳什均衡保证收敛性,并在大量模拟中进行了评估,展示其胜过基线的导航成功率。同时,实施了实物实验以验证训练出的策略在实时飞行中的有效性。