基于学习控制的线性模型预测安全认证
本研究介绍了一种学习基础的模型预测控制 (LBMPC) 方案,在提高系统性能的同时提供稳健性的确定性保证。该方案利用统计识别工具识别系统的更丰富模型,通过维护两个模型,可以在一个优化框架中将安全性和性能隔离。LBMPC 通过选择最小化成本的输入来提高性能,并通过检查模糊模型稳定性来确保安全性和鲁棒性。此外,我们证明如果系统充分兴奋,则 LBMPC 控制行动以概率收敛为使用真实动力学计算的 MPC 的行动。
Jul, 2011
本文提出了一种基于学习的模型预测控制方案,其可以提供可证明的高概率安全保证,并利用正态分布先验的规则性假设来构建可证明准确的置信区间,保证轨迹满足安全约束,通过终端集约束递归地保证每个迭代中存在安全控制动作。在实验中展现了该算法可以用来安全、高效地探索和学习动态系统。
Mar, 2018
本文提出了一种可微分的线性二次模型预测控制(MPC)框架,用于安全模仿学习,其中利用从离散时间代数Riccati方程(DARE)获得的终端成本函数强制实施无限地平线成本,以便能够证明所学控制器在闭环中稳定。该框架的学习能力在一组数值研究中得到了证明。
Jan, 2020
本论文通过神经网络(NN)的逼近研究模型预测控制(MPC)控制器,以实现快速在线计算,并通过安全增强提高收敛和实现约束满足的确定性保证。其控制框架在三个具有不同复杂度的非线性MPC基准测试中得到阐述,并证明了与在线优化相比的数量级的计算加速。
Apr, 2023
通常,学习和控制过程中利用约束安全证书的技术被用于保证安全性,但是过高的模型不确定性可能使得鲁棒安全认证方法变得不可行。本文考虑了基于控制屏障函数(CBF)二阶锥规划的具有鲁棒安全证书的学习环境,在该环境下,如果控制屏障函数证书是可行的,我们的方法将利用它来保证安全性。否则,我们的方法通过探索系统动力学来收集数据,恢复控制屏障函数约束的可行性。我们采用了一种受贝叶斯优化中成熟工具启发的方法。我们证明,如果采样频率足够高,我们可以恢复鲁棒CBF证书的可行性,从而保证安全性。我们的方法不需要先验模型,据我们所知,这是第一个在存在偶尔不可行安全证书的情况下无需备份非学习型控制器即可保证安全的算法。
Nov, 2023
本文提出了一种新的参数化控制器,借鉴了模型预测控制(Model Predictive Control)的思想。这些控制器采用与线性模型预测控制类似的二次规划结构,通过学习问题参数而不是从模型中导出。该方法可能解决深度强化学习中常见学习控制器(如多层感知器架构)在解释性和性能保证方面的局限性。学习到的控制器不仅具有与模型预测控制相似的可验证特性,如持续可行性和渐近稳定性,而且在控制性能上与模型预测控制和多层感知器控制器达到了相当的经验证明,与模型预测控制相比,在实施上更具计算效率,并且比多层感知器控制器需要更少的可学习策略参数。通过展示车辆漂移操纵任务的实际应用,展示了这些控制器在实际场景中的潜力。
Dec, 2023
设计预测控制器以实现闭环性能最优化,同时保持安全和稳定性是具有挑战性的。本文通过在考虑闭环稳定性的情况下,利用受限贝叶斯优化来学习预测控制参数,将成本函数参数化为前馈神经网络,并进行闭环行为和模型-过程不匹配的最小化,从而提供了高自由度和有效全局优化实现期望的闭环行为。我们通过学习控制器参数的稳定性约束扩展了这个框架,并利用底层MPC的最优值函数作为一个Lyapunov候选。模拟结果验证了所提出方法的有效性,突显了其性能和安全能力。
Apr, 2024
本研究针对模型预测控制算法在快速应用和低功耗边缘设备中面临的优化挑战,提出了一种基于机器学习的解决方案。通过使用前馈神经网络减少在线优化的计算负担,同时确保安全性和约束满足,该方法在模拟中验证了计算效率的提升,并保持近最佳性能。这一方案可广泛应用于机器人和嵌入式等需快速响应的场景。
Aug, 2024
本研究解决了在不完全信息条件下,控制策略学习中的安全性问题。通过应用贝叶斯优化,我们提出了一种灵活的参数化最优控制方法,确保闭环系统的长期性能,同时提供严格的概率安全保障。研究表明,该方法在确保系统安全和稳定的前提下,有效提升了闭环控制性能。
Sep, 2024