Jun, 2015

有条件和驱动过程的变分和最优控制表示

TL;DR本文提出一种基于 Doob 的 h 变换的 Markov 过程,并使用大偏差函数和相对熵等原理对其进行了解释和推广,包括控制方法和近似大偏差函数的新方法。