May, 2020

基于消耗马尔可夫决策过程的定性控制合成

TL;DR本文研究了 Consumption Markov Decision Processes(CMDPs)中具有几乎确定的 B"uchi 对象的策略综合的复杂性,并证明了该问题可以在多项式时间内解决。 我们实施了该算法,并证明它可以有效地解决模拟真实情景的 CMDP 问题。