Apr, 2019

通过概率动作语言pBC+的决策论扩展,实现对马尔可夫决策过程的扩展容错性表示

TL;DR该研究将概率行动语言pBC+扩展为,在决策理论中引入效用的概念;pBC+的语义可以定义为概率答案集编程语言LPMLN的决策论扩展的速记符号;也可以用马尔科夫决策过程(MDP)的术语来定义pBC+的语义,从而以简洁且容易理解的方式表示MDP,并利用MDP求解器计算pBC+。因此,可以设计系统pbcplus2mdp,使用MDP求解器查找pBC+操作描述的最优策略。