Nov, 2013

高斯赌博机的 Thompson 抽样策略的最优性取决于先验知识

TL;DR探讨多参数模型中 normal distribution 模型下 Thompson sampling 算法的优化问题及其 prior 选择的影响