Mar, 2021
有限时间和流式无休止多臂赌博机问题的高效算法
Efficient Algorithms for Finite Horizon and Streaming Restless Multi-Armed Bandit Problems
Aditya Mate, Arpita Biswas, Christoph Siebenbrunner, Susobhan Ghosh, Milind Tambe
TL;DR提出了 “Streaming Bandits” 框架,该框架为不安宁的多臂赌博机问题,其中异构臂可以在有限寿命后进入和离开系统。该框架自然地解决了卫生干预计划问题,同时提供了一个新颖而高效的算法来计算 Whittle 索引解。