May, 2023
GAN-MPC: 使用来源于不同专家的演示训练参数化成本函数的模型预测控制器
GAN-MPC: Training Model Predictive Controllers with Parameterized Cost Functions using Demonstrations from Non-identical Experts
Returaj Burnwal, Anirban Santara, Nirav P. Bhatt, Balaraman Ravindran, Gaurav Aggarwal
TL;DR使用对抗生成网络的学习型 MPC 策略可以通过模仿学习来解决某些困难的 MPC 优化问题,特别是当展示代理和模仿代理不重叠时。