Oct, 2011

分散式 POMDP 的最优和近似 Q 值函数

TL;DR本文研究决策理论规划在单智能体和分布式 POMDP 模型中的应用,提出了一种可行的计算方法并对其算法进行了评估。