BriefGPT.xyz
Ask
alpha
关键词
uncertain mdps
搜索结果 - 2
强健的马尔可夫决策流程即时学习
本文介绍了一种鲁棒的任意学习方法,该方法结合了贝叶斯推断模型和计算稳健策略的方法,以不确定性马尔科夫决策过程(uMDPs)为基础,并通过实验验证了该方法的有效性。
PDF
2 years ago
AAAI
基于极小化遗憾优化的不确定马尔可夫决策过程鲁棒规划
本文旨在通过引入一种 Bellman 方程式来计算政策的懊悔,提出了一种基于动态规划算法的方法,以便为具有不确定成本和转移函数的 SSP UMDPs 规划,该方法精确地优化了具有独立不确定性的 UMDPs 的最小化极大遗憾,并通过选项扩展了
→
PDF
4 years ago
Prev
Next