Most existing neural network-based approaches for solving stochastic optimal
control problems using the associated backward dynamic programming principle
rely on the ability to simulate the underlying state variables. However, in
some problems, this simulation is infeasible, leading to
我们考虑从有限数量的(状态 - 输入)- 后继状态数据点中设计一种基于机器学习的未知动态系统模型的问题,以便获得的模型也适用于最优控制设计。我们提出了一种特定的神经网络(NN)结构,其产生具有分段仿射动力学的混合系统,对网络参数具有可微性,从而使得能够使用基于导数的训练过程。我们展示了对 NN 权重的精心选择产生具有结构特性的混合系统模型,在有限视野最优控制问题(OCP)的计算方面具有非常有利条件。具体而言,我们表明可以通过非线性规划计算具有强大局部最优性保证的最优解,与通常需要混合整数优化的一般混合系统的经典 OCP 相比。除了非常适用于最优控制设计外,数值模拟还说明我们基于 NN 的技术在混合系统的系统识别方法方面具有非常类似的性能,并且在非线性基准测试中具有竞争力。