Mar, 2024

基于 PPO 的 DRL 自校准非线性 PID 无人机控制器实现鲁棒自主飞行

TL;DR该研究旨在通过应用非线性深度强化学习(DRL)代理作为传统线性比例积分微分(PID)控制器的替代品,从而彻底改革无人机飞行控制。主要目标是实现无人机在手动和自主模式之间的无缝过渡,提高其响应性和稳定性。利用 Gazebo 模拟器中的 Proximal Policy Optimization(PPO)强化学习策略训练 DRL 代理,并通过添加价格为 20000 美元的室内 Vicon 跟踪系统实现 < 1mm 的定位精度,从而大大提高了自主飞行的精确性。为了在最短的无碰撞轨迹下引导无人机导航,我们还构建了一个三维 A * 路径规划器,并成功将其应用到实际飞行中。