May, 2023

参数化和加权 MDP 的基于图形的约简

TL;DR本文章研究了参数化马尔可夫决策过程中、权重可达性问题的缩减复杂度。该问题的计算复杂度为 coETR-complete,但是我们在此研究中提出了一种多项式时间算法,可以计算马尔可夫链的 order 等价类,并且描述和实现了两个推断规则,用于近似评估该问题,并且证实此方法可以作为大型马尔可夫决策过程分析的有效预处理步骤。