AAAIOct, 2022
具备到达避免保证的随机系统学习控制策略
Learning Control Policies for Stochastic Systems with Reach-avoid Guarantees
Đorđe Žikelić, Mathias Lechner, Thomas A. Henzinger, Krishnendu Chatterjee
TL;DR本论文介绍了一种利用神经网络提供形式化到达 - 避免保证的方法,通过在随机非线性动态系统中学习控制器来解决实现证明的问题,以及提出了超级马丁格尔的概念作为证明,并通过对 Lyapunov 函数的确定性系统的随机扩展上的级集的约束来提供可达性和避开保证。