belief state policy | BriefGPT

关键词belief state policy

搜索结果 - 1

AAAI部分可观察马尔可夫决策过程的基于点的模型检验方法
提出了一种在部分可观察的马尔可夫决策过程（POMDP）中实现满足线性时间逻辑公式的策略的方法，该方法使用基于点的价值迭代方法来高效地近似满足所需逻辑公式的最大概率，并计算相应的置信状态策略。证明该方法适用于大型 POMDP 领域，并为最终策
PDF4 years ago