Aug, 2010
策略迭代在常数贴现率下的 2 人回合制随机博弈中具有强多项式时间复杂度
Strategy iteration is strongly polynomial for 2-player turn-based stochastic games with a constant discount factor
Thomas Dueholm Hansen, Peter Bro Miltersen, Uri Zwick
TL;DR本文利用改进的单纯形法、策略迭代算法及策略提升算法的收敛速度,利用最小化操作步数的方法,解决了两人纯策略有限的保底价值为零的零和收益随机博弈的问题。