Jul, 2012

启发式搜索值迭代用于 POMDPs

TL;DR本文提出了一种名为启发式搜索值迭代 (HSVI) 的新型 POMDP 规划算法,采用注意力集中搜索启发式和分段线性凸表示值函数的技术相结合,可在保证收敛与正确性的情况下提高计算速度,并在大规模问题上运用效果良好。