Nov, 2022

使用广义行动控制器进行安全控制和学习

TL;DR本文介绍了一种名为广义动作管制器的监督方案,该方案可以为惯性闭环系统提供强制性处理约束的能力。在介绍其理论为一般系统和为线性和离散系统提供的定制设计方法后,我们讨论了其在安全在线学习中的应用,即旨在使用实时数据安全地演变控制参数以改进不确定系统的性能。特别地,我们提出了两个安全学习算法,这些算法基于增强学习/数据驱动Koopman运算符控制与广义动作管制器的集成。发展成果可以通过数字实例来说明。