Sep, 2022

使用 Voronoi 树进行自适应离散化来处理连续动作 POMDP

TL;DR该论文介绍了一种新的基于采样的在线POMDP求解器,名为Adaptive Discretization using Voronoi Trees(ADVT)。它使用Monte Carlo tree search与适应性离散化的行动空间,以及乐观优化来高效地采样高维连续行动空间并计算最佳行动,该策略使ADVT更好地利用行动空间中的局部信息,从而导致行动空间的离散化更加适应,因此在计算好的POMDP解方面更加有效。