Oct, 2018

可微分模型预测控制(MPC)用于端到端规划与控制

TL;DR该研究提出了一种利用模型预测控制(MPC)作为可微政策类来学习连续状态和行动空间中的强化学习的基础,通过使用控制器固定点处的凸逼近的KKT条件区分MPC,从而能够学习控制器的成本和动力学,旨在提高数据效率并优于传统系统识别。