BriefGPT.xyz
Ask
alpha
关键词
distributionally robust markov decision process
搜索结果 - 2
动态流行病控制中的决策依赖鲁棒马尔可夫决策过程方法
本文提出了一种分布鲁棒马尔科夫决策过程 (DRMDP) 方法来解决动态流行病控制问题,使用实时动态规划 (RTDP) 算法计算新的 DRMDP 模型的最优策略,预测出针对新冠病毒的疫苗接种和传输减少措施效果更好。
PDF
a year ago
面向序列决策的分布稳健优化
该研究探讨了在不确定参数的最具对抗性分布下,实现最大期望总回报的分布鲁棒 MDP,通过在模糊集格式中加入不确定性的广义矩和统计距离信息,将泛化动量和统计距离模糊集的现有研究推广到后者类别,进而提出了一种新的描述不确定性空间的模糊集形式。在此
→
PDF
6 years ago
Prev
Next