Nov, 2023

在具有概率保证和实践的连续 POMDP 规划中简化复杂的观测模型

TL;DR使用简化观测模型进行规划,同时保证解决方案的质量,无需在规划过程中访问昂贵的模型,以统计总变差距离为基础提出了一种新的概率界,通过广义化最近的粒子 - 信念 MDP 收敛性界限的结果来限制理论 POMDP 值与简化模型下的经验规划值之间的差距,并演示了如何将这种界限整合到现有的连续在线 POMDP 求解器的常规例程中。