Sep, 2011

FluCaP:用于一阶 MDPs 的启发式搜索规划器

TL;DR该论文提出了一种启发式搜索算法来解决一阶马尔可夫决策过程,其方法结合了一阶状态抽象和启发式搜索,以避免对所有状态进行评估,并通过可达性引导来限制搜索。该方法在国际计划竞赛中取得了较好的成绩。