Jun, 2024

基于学习的具有神经网络策略的随机动力系统的验证

TL;DR我们考虑在随机动力系统中验证神经网络策略以达到避碰控制任务,并使用一个证明该策略满足任务的神经网络作为证书的验证过程。我们对验证神经网络是 RASM 的算法方法进行了显著加速,并通过通过加权范数计算神经网络的 Lipschitz 常数的新颖且快速的方法以及集成了高效的局部细化方案来实现比现有方法更粗的离散化。我们对多个基准测试和使用不同强化学习算法训练的神经网络策略进行了实证评估,结果表明我们的方法在验证神经网络策略方面是有效的。