Nov, 2018

鲁棒马尔可夫决策过程:超越矩形假设

TL;DR本论文利用因子模型处理 Markov 决策过程中的参数不确定性问题,提出了一种鲁棒性方法来有效计算最优策略,并在相关领域进行了实验研究。