Sep, 2013
多目标马尔可夫决策过程中 Lorenz - 最优解的近似
Approximation of Lorenz-Optimal Solutions in Multiobjective Markov Decision Processes
Patrice Perny, Paul Weng, Judy Goldsmith, Josiah Hanna
TL;DR本篇论文研究了多目标马尔可夫决策过程中的公平优化问题,并介绍了一种高效逼近无限时段,折扣多目标马尔可夫决策过程中 Lorenz 非支配解的方法。