Jan, 2013

弱耦合的马尔科夫决策问题的灵活分解算法

TL;DR本文提出了两种新的方法来分解和解决大型马尔可夫决策问题(MDPs),分别为部分解耦方法和完全解耦方法。这些方法可以用于发现最优策略或近似最优策略,并提供了一种有效的知识传递框架。