BriefGPT.xyz
Ask
alpha
关键词
relational markov decision processes
搜索结果 - 2
利用一阶回归进行归纳策略选择
我们研究了基于关系型马尔可夫决策过程的最优泛化策略计算问题,提出了一种结合归纳技术和符号动态规划方法的方法,以自动生成与问题领域相关的假设语言作为归纳求解器的输入来回避复杂的符号动态规划推理。
PDF
12 years ago
关系马尔可夫决策过程的一阶决策图
研究证明,使用新的紧凑表示 ——FODD,可以解决 RMDPs,通过 FODDs 操作开发价值迭代算法,并证明该算法完全收敛且具有独立于领域大小或实例化的最佳策略。
PDF
13 years ago
Prev
Next