Aug, 2021

基于元数据的贝叶斯分层模型多任务赌博机

TL;DR在这篇论文中,我们引入了基于元数据的多任务赌博机问题,提出了一种基于贝叶斯分层模型的任务关系捕捉方法,并设计了一个 Thompson 抽样算法来高效地学习任务关系、共享信息,并最小化累计遗憾。通过对高斯赌博机和伯努利赌博机的分析,我们证明了信息共享的算法的好处。该方法还得到了广泛的实验支持。