Sep, 2016

可索引和不可索引的不安定赌博机的渐进最优优先策略

TL;DR本文研究了多类不定期赌徒的渐近最优控制问题,并提出了一类优先级策略,证明了在全局吸引子属性和技术条件下其是渐近最优的。我们将流体缩放技术与线性规划结果相结合,证明了当赌徒可索引时,Whittle 的索引策略包含在我们的一类优先级策略中。我们总结提出一些结论,包括关于如何选择来自渐近最优策略类的优先级策略等方面。