Nov, 2023

通过鲁棒不变集的分解学习预测性安全过滤器

TL;DR提出了一个理论框架,通过捕捉非线性系统中的状态和动作相关的不确定性,综合应用稳健模型预测控制(RMPC)和强化学习(RL),以合成非线性系统的安全过滤器,其计算复杂度较低且具有持久的鲁棒安全保证。