May, 2023

具有外部时间进程的马尔可夫决策过程

TL;DR本文研究在外部时间过程的影响下的马尔可夫决策过程,提出了一个策略迭代算法来解决这个问题,并对其性能进行了理论分析。