Nov, 2022

混合信念 POMDP 中的蒙特卡罗规划

TL;DR本文介绍了 Hybrid Belief Monte Carlo Planning (HB-MCP) 算法,利用 Monte Carlo Tree Search (MCTS) 算法来解决部分可观测马尔科夫决策过程 (POMDP) 问题,同时维护混合信念。研究者采用上置信区间 (UCB) 探索奖励来结合概率分布树和信任度分布树,以引导假设树的增长,同时在解决未解决数据关联问题的高度别名模拟环境中评估了该方法的有效性。