Apr, 2024

分布鲁棒策略与李雅普诺夫证明学习

TL;DR论文介绍了一种新颖的方法,用于在模型不确定性下合成分布鲁棒的稳定神经控制器和控制系统的证书。通过采用一种新颖的分布鲁棒的 Lyapunov 导数机会约束公式,确保 Lyapunov 证书的单调减少,解决了不确定系统稳定性保证控制器设计中的关键挑战。将这个条件整合到用于训练基于神经网络的控制器的损失函数中,证明了在包括超出分布范围的模型不确定性的情况下,闭环系统的全局渐近稳定性可以得到高可信度的认证。通过在两个控制问题的模拟过程中,将该方法与无关不确定性的基准方法和几个强化学习方法进行比较,验证了所提出方法的有效性和高效性。