Nov, 2023

初始化未知模型和不可行安全证书下的安全在线动态学习

TL;DR通常,学习和控制过程中利用约束安全证书的技术被用于保证安全性,但是过高的模型不确定性可能使得鲁棒安全认证方法变得不可行。本文考虑了基于控制屏障函数(CBF)二阶锥规划的具有鲁棒安全证书的学习环境,在该环境下,如果控制屏障函数证书是可行的,我们的方法将利用它来保证安全性。否则,我们的方法通过探索系统动力学来收集数据,恢复控制屏障函数约束的可行性。我们采用了一种受贝叶斯优化中成熟工具启发的方法。我们证明,如果采样频率足够高,我们可以恢复鲁棒 CBF 证书的可行性,从而保证安全性。我们的方法不需要先验模型,据我们所知,这是第一个在存在偶尔不可行安全证书的情况下无需备份非学习型控制器即可保证安全的算法。