Aug, 2023

经济非线性 MPC 的 Koopman 模型的端到端强化学习

TL;DR(经济) 非线性模型预测控制 ((e) NMPC) 需要全方位准确的动态系统模型,这些模型在所有相关的状态空间区域中都足够准确,并且计算便宜到足以确保实时可行性。我们提出了一种端到端的强化学习方法,用于动态代理模型在 (e) NMPC 应用中实现最优性能,从而在控制性能和计算需求之间实现了良好的平衡。我们在两个应用中验证了我们的方法,这两个应用是基于一个已建立的非线性连续搅拌反应器模型。我们将控制器性能与使用主导的最大预测准确性范例训练的模型的 MPC 进行了比较,并使用强化学习训练的无模型神经网络控制器进行了比较。我们展示了我们的方法与无模型神经网络控制器的性能相当,同时始终优于基于系统识别的模型。此外,我们还展示了 MPC 策略在控制设定变化时无需重新训练。