Feb, 2025

模型预测控制与强化学习的综合:调查与分类

TL;DR本文研究了模型预测控制(MPC)与强化学习(RL)之间的关系,探讨了它们在马尔可夫决策过程中的不同应用与优势。通过分析两者的基本原理和技术差异,本文提出了一种基于演员-评论家方法的分类框架,并展示了如何利用MPC的在线优化方法提升政策的整体闭环性能。该研究为结合这两种控制技术的发展奠定了基础,可能推动多个实际应用领域的进步。