Jul, 2012

用连续和离散变量解决因式化马尔可夫决策过程

TL;DR我们提出了一个框架来处理离散和连续变量的混合模型的随机规划问题,使用混合马尔可夫决策过程的方法,通过线性规划近似来解决这些问题,并遵循混合动态贝叶斯网络的表示形式,已在一系列控制问题中进行了实验。