Jun, 2024

自主翱翔的模仿强化学习框架

TL;DR本文提出了一种新颖的模仿式强化学习框架,通过高效利用专家数据进行自主探索,不仅提高了学习效率,还通过强化学习实现了对动态环境的适应性,在无人战斗机的领域中学习到了成功的战斗策略。在基于 Harfang3D 沙盒环境上的实验中,我们的框架在多阶段空战中表现出色,显著优于现有的强化学习和模仿学习方法,具备模仿专家和自主探索的能力,能够快速学习复杂的空中作战任务中的关键知识,实现高达 100%的成功率并展示出极佳的稳健性。