Jul, 2022

ChronosPerseus: 随机基于点的价值迭代与重要性采样在POSMDPs中的应用

TL;DR本文提出了一种新的基于重要性采样的PBVI算法 -- ChronosPerseus,它支持在决策中整合连续流逝时间分布,并能有效减少算法的复杂度。算法还适用于情节式和非情节式问题,并提供了两个实例作为示范。