Feb, 2013

增量剪枝:一种针对部分可观测马尔可夫决策过程的简单、快速、精确方法

TL;DR本研究探讨了部分可观察马尔可夫决策过程(POMDPs)的精确算法,利用动态规划将值函数的分段线性和凸表示转换为另一个表示,并比较了增量修剪方法的变种与更早的算法在理论和实证方面的差异。我们发现增量修剪是目前解决 POMDPs 最有效的精确方法。