Jul, 2011

关于POMDP中随机控制器优化的计算复杂性

TL;DR在马尔科夫决策过程中找到最优的随机控制器是NP难问题,该问题也适用于具有观察不完全性质的马尔科夫过程,但我们提出了一种特例,是凸的且具有有效的全局解。