Feb, 2023
四旋翼无人机跟踪控制系统的可信强化学习
Trustworthy Reinforcement Learning for Quadrotor UAV Tracking Control Systems
Yanran Wang, David Boyle
TL;DR提出了一种新型的轨迹跟踪器,其集成了分布式强化学习扰动估计器和随机模型预测控制器,用于准确识别不确定的气动效应,并优化控制参数来保证凸性,实现了至少最优全局收敛速率和一个确定的亚线性速率,对于实际应用提出的 ConsDRED-SMPC 框架在在模拟和实际实验中均得到了验证和评估