Mar, 2024

四旋翼飞行器控制的自适应增益调度

TL;DR本文通过使用强化学习技术 (Reinforcement Learning, RL) 来调整四旋翼控制器的控制增益,特别地,我们采用了近端策略优化 (Proximal Policy Optimization, PPO) 来训练一个根据实际情况调整控制增益的策略,其中主要目标是在跟随预定轨迹的同时最小化跟踪误差。本文的主要目的是分析自适应增益策略的有效性,并将其与静态增益控制算法的性能进行比较,使用积分平方误差和积分时间平方误差作为度量标准。结果表明,与静态增益控制器相比,自适应增益方案实现了超过 40% 的跟踪误差降低。