Oct, 2012

面向目标的 MDP 模型中的死路理论

TL;DR本文提出了三种新的 MDP 类,允许无法到达的目标,并呈现了具有理论基础的算法,探讨了这些类之间的理论关系,并进行了初步的实证研究。