BriefGPT.xyz
Ask
alpha
关键词
hamilton--jacobi--bellman equation
搜索结果 - 3
关于 Lipschitz 连续控制问题的稳定性及其在强化学习中的应用
我们研究了模型无关的强化学习环境下 Hamilton-Jacobi-Bellman 方程的稳定性属性,特别是对于 Lipschitz 连续最优控制问题。通过在动力学和奖励函数中引入结构假设,我们进一步研究了值函数的收敛速度。此外,我们引入了
→
PDF
3 months ago
深度学习中产生的受控粒子系统的收敛性分析:从有限样本到无限样本大小
该文研究了一类神经随机微分方程的极限行为,推导出一种关于神经随机微分方程的最优控制问题的汉密尔顿 - 雅可比 - 贝尔曼方程,通过分析反向随机黎卡蒂方程得出一种统一的正则估计结果,利用这些正则估计结果展示了目标函数极小值和神经随机微分方程的
→
PDF
3 months ago
基于路径 HJB 操作符的随机系统的神经最优控制器
基于物理知识学习和动态规划,该研究旨在开发基于深度学习的算法来解决高维随机控制问题;通过引入与 Hamilton-Jacobi-Bellman 方程相关的路径操作,定义了一个物理知识学习问题,并提出了两种数值方法来求解该问题。研究对截断误差
→
PDF
4 months ago
Prev
Next