Feb, 2013

解决马尔可夫决策问题的复杂性

TL;DR本文总结了解决 Markov 决策问题及其算法运行时间的复杂性,并讨论了需要进一步研究实际算法来快速解决大问题的问题。同时,本文提出了一些基于 MDP 结构的替代分析方法,以鼓励未来的研究。