Feb, 2025

连续空间中的任意增量ρPOMDP规划

TL;DR本研究解决了现有在线ρPOMDP求解器在连续空间中因固定信念表征而限制适应性和精炼性的问题。本文提出了ρPOMCPOW,一个动态精炼信念表征的任意求解器,并采用新颖的增量计算方法来降低信念依赖奖励更新的计算成本。实验结果表明,ρPOMCPOW在效率和解决方案质量上优于现有最先进的求解器。