May, 2023

GAN-MPC: 使用来源于不同专家的演示训练参数化成本函数的模型预测控制器

TL;DR使用对抗生成网络的学习型 MPC 策略可以通过模仿学习来解决某些困难的 MPC 优化问题,特别是当展示代理和模仿代理不重叠时。