Feb, 2024

基于路径 HJB 操作符的随机系统的神经最优控制器

TL;DR基于物理知识学习和动态规划,该研究旨在开发基于深度学习的算法来解决高维随机控制问题;通过引入与 Hamilton-Jacobi-Bellman 方程相关的路径操作,定义了一个物理知识学习问题,并提出了两种数值方法来求解该问题。研究对截断误差,逼近误差和优化误差对这些方法的准确性的影响进行了错误分析,并提供了各种应用的数值结果来说明所提算法的性能。