Sep, 2009

部分可观察马尔可夫决策过程的定性分析

TL;DR本文针对部分可观察 Markov 决策过程(POMDPs)和 ω 正则目标,研究了基于观测的策略,并解决了定性分析问题的计算复杂度和最优内存界限。