Sep, 2022

具有时态目标部分有序偏好的概率规划

TL;DR本文研究了具有对时间目标的偏好的随机系统规划,并引入了一种特殊类型的有限状态自动机,它被称为 “喜好自动机”。作者将该自动机转化为被用于概率规划的策略偏好,建立了多目标马尔可夫决策过程并证明了其有效性。