Sep, 2015

基于 MPC 引导的策略搜索学习自主飞行器深度控制策略

TL;DR模型预测控制与强化学习相结合并在引导策略搜索框架下应用,通过使用机载传感器数据在训练时间内训练神经网络策略,该策略可成功地控制四旋翼飞行器的避障而无需系统完整状态知识。