Oct, 2014

在线自助Bootstrap的汤普森抽样

TL;DR介绍了一种改进的 Thompson sampling 方法——bootstrap Thompson sampling,通过引入 bootstrap 分布替换后验分布,提高了其在大规模 bandit 问题中的可扩展性和面对误分布的鲁棒性。