Sep, 2013

多目标马尔可夫决策过程中 Lorenz - 最优解的近似

TL;DR本篇论文研究了多目标马尔可夫决策过程中的公平优化问题,并介绍了一种高效逼近无限时段,折扣多目标马尔可夫决策过程中 Lorenz 非支配解的方法。