Feb, 2024

使用双层马尔可夫决策过程进行空间任务的应急计划

TL;DR该研究侧重于科学任务的自主应变规划,通过允许从状态空间的任何非正常点快速计算决策,以应对与正常任务计划的延误或偏离。通过提出双层马尔可夫决策过程(MDP)框架,改进了计算可处理性,同时与现有任务规划实践相吻合并增强了基于人工智能的解决方案的可解释性和可信度,通过将任务规划 MDP 转化为双层 MDP 来讨论了这一框架,并在 RoverGridWorld 上对其进行了测试,这是一个用于漫游任务规划的改进的 GridWorld 环境。我们展示了使用双层 MDP 方法实现的计算可处理性和近似最佳策略,突出了问题复杂性增加时计算时间和政策最优性之间的权衡。这项研究有助于更高效和灵活地应对科学任务的应变规划。