Apr, 2023

CAR-DESPOT: 机器人在混杂环境中基于因果推断的在线 POMDP 规划

TL;DR本文提出了使用因果建模和推理的新型持续时间在线部分可观测树规划器的因果知情扩展,以消除未测量混淆变量所引起的误差。同时,我们提出了一种离线学习因果模型的方法,用于规划。我们在一个具有未观察到混淆因素的玩具问题上评估了我们的方法,并表明所学习的因果模型非常准确,而我们的规划方法比 AR-DESPOT 更加抗干扰,并产生更高性能的策略。