Feb, 2024

基于贝叶斯方法的在线学习对于上下文不安定赌博算法的应用于公共卫生

TL;DR基于贝叶斯学习和汤普森抽样的上下文多臂赌博机在线强化学习方法可以高效建模复杂的上下文相关和非固定的公共卫生干预项目中的资源分配,具有较高的性能表现。