Jul, 2012

利用一阶回归进行归纳策略选择

TL;DR我们研究了基于关系型马尔可夫决策过程的最优泛化策略计算问题,提出了一种结合归纳技术和符号动态规划方法的方法,以自动生成与问题领域相关的假设语言作为归纳求解器的输入来回避复杂的符号动态规划推理。