Feb, 2024
基于贝叶斯方法的在线学习对于上下文不安定赌博算法的应用于公共卫生
A Bayesian Approach to Online Learning for Contextual Restless Bandits with Applications to Public Health
Biyonka Liang, Lily Xu, Aparna Taneja, Milind Tambe, Lucas Janson
TL;DR基于贝叶斯学习和汤普森抽样的上下文多臂赌博机在线强化学习方法可以高效建模复杂的上下文相关和非固定的公共卫生干预项目中的资源分配,具有较高的性能表现。