Jul, 2022
ChronosPerseus: 随机基于点的价值迭代与重要性采样在POSMDPs中的应用
ChronosPerseus: Randomized Point-based Value Iteration with Importance
Sampling for POSMDPs
TL;DR本文提出了一种新的基于重要性采样的PBVI算法 -- ChronosPerseus,它支持在决策中整合连续流逝时间分布,并能有效减少算法的复杂度。算法还适用于情节式和非情节式问题,并提供了两个实例作为示范。