IJCAIMay, 2021

适应性干预学习策略:在预防保健中应用于不稳定赌博机

TL;DR研究了在公共卫生领域中,如何通过 Q-learning 基于 Whittle 指数的机制,解决患者逐渐脱离健康项目的问题。