通过解决 MPC 控制器在现实场景下系统识别学习失败的问题,将其转化为部分观察马尔科夫决策过程,通过循环强化学习不断地适应动态模型参数,该论文提出了一种自适应控制算法 (MPC-RRL),最终在 CARLA 模拟器中得出了具有鲁棒性和可靠性的自动驾驶控制效果。
Jan, 2023
本文提出了基于概率模型预测控制(MPC)的基于模型的 RL 框架,以减少与环境的相互作用次数的方法。该方法使用高斯过程学习概率转换模型来减少模型误差的影响,同时使用 MPC 找到最小化预期长期成本的控制序列,以达到在受限环境下使用 RL 的目的。
Jun, 2017
本研究提出了一种基于信息理论模型预测控制和熵正则化强化学习的 Q 学习算法,可以利用有偏模型,并在模拟控制任务中验证了该算法的有效性。
Dec, 2019
该研究论文提出了一种用于动态系统的模型预测控制(MPC)方法,该方法利用深度神经网络(NNs)对系统的非线性和不确定性进行建模,并提出了两种用于解决 MPC 问题的方法:混合整数规划(MIP)方法和线性松弛(LR)方法。进行了广泛的数值模拟来演示和比较 MIP 和 LR 方法的性能。
May, 2024
通过机器学习优化基于样本的模型预测控制中的更新规则,以在有限的样本数下获得更好的控制效果。
Dec, 2022
本文提出了一种基于动态镜像下降 (DMD) 的模型预测控制 (MPC) 算法 (DMD-MPC),该算法结合了在线学习算法的思想,是一种通用的 MPC 算法,并在实验中展示了其适用性。
Feb, 2019
本文提出了一种将强化学习与模型预测控制相结合的方法,以充分利用两者的优势,并获得既具有最优性又安全的控制器。在模拟中,我们通过数值实验证明了该方法的有效性。
Jun, 2019
基于采样的模型预测控制已经在具有非光滑系统动力学和成本函数的最优控制问题中取得了重大的成功,我们提议通过元强化学习学习一个优化器来更新控制器,该优化器不需要专家演示,并且在未知控制任务中可以实现快速适应。
Jan, 2024
基于深度神经网络的非线性模型预测控制(MPC)在同质压燃点火(HCCI)燃烧控制方面的实验实施结果良好,具有优秀的 IMEP 轨迹跟踪性能和过程约束的观测情况。
Oct, 2023
本文采用滤波器感知的模型预测控制方法,既考虑了不确定性的影响,又可以通过建立一个包含感知能力的模型来显著提高控制性能。
Apr, 2023