Oct, 2022

指数可索引性对Whittle算法不足:无静止赌博机改进的近似最优算法

TL;DR本论文探讨了不安定多臂赌博机的规划问题,提出了一种基于均场方法的规划算法来获得近似最优策略。通过实验分析,该算法在实际应用中表现优异且无需外部超参数。