Aug, 2010

策略迭代在常数贴现率下的 2 人回合制随机博弈中具有强多项式时间复杂度

TL;DR本文利用改进的单纯形法、策略迭代算法及策略提升算法的收敛速度,利用最小化操作步数的方法,解决了两人纯策略有限的保底价值为零的零和收益随机博弈的问题。