BriefGPT.xyz
Ask
alpha
关键词
sd-mdp
搜索结果 - 1
基于蒙特卡洛规划的约束马尔可夫决策过程的随机控制
在随机控制的领域中,尤其是在经济学和工程学中,马尔可夫决策过程(MDPs)能够有效地建模各种随机决策过程,从资产管理到运输优化。本文定义了一个 MDP 框架,SD-MDP,通过解开 MDPs 的转移和奖励动态的因果结构,提供了时间因果图上的
→
PDF
13 days ago
Prev
Next