Dec, 2023

神经时间反演广义瑞克蒂方程

TL;DR本文介绍了一种新颖的基于神经网络的最优控制方法,该方法旨在通过在时间上前进来实现最优控制。神经网络不仅用于实施状态动态,还用于估计共轭变量。通过引入一种新的局部策略,即时间反转的广义 Riccati 方程,来确定后一网络的参数。通过讨论一系列最优控制案例研究的实验结果,我们支持这个猜想,即这个策略能够稳定状态动态。