Mar, 2012

动态、部分已知环境下的概率系统控制与时间逻辑规格

TL;DR针对由马尔可夫决策过程建模的概率系统,考虑在部分已知环境下综合控制策略,环境由一组马尔可夫链建模,其中每个马尔可夫链描述了环境的不同模式,但环境的模式对于系统是未知的。控制目标为最大化系统满足给定规范的期望概率和最大化最坏情况下满足规范的概率。