IJCAIMay, 2021
适应性干预学习策略:在预防保健中应用于不稳定赌博机
Learn to Intervene: An Adaptive Learning Policy for Restless Bandits in Application to Preventive Healthcare
Arpita Biswas, Gaurav Aggarwal, Pradeep Varakantham, Milind Tambe
TL;DR研究了在公共卫生领域中,如何通过 Q-learning 基于 Whittle 指数的机制,解决患者逐渐脱离健康项目的问题。