Feb, 2016

面向不确定性的机器人强鲁棒规划中的 POMDP-lite

TL;DR本文介绍了一种子类部分可观察马尔可夫决策过程 (POMDP), 即 POMDP-lite, 使用该方法解决机器人任务时计算复杂度减小,我们开发了一种基于贝叶斯强化学习算法来解决 POMDP-lite 模型,效果优于当前最先进的 POMDP 算法且在适当条件下该算法接近贝叶斯最优。