Jul, 2015

引导式汤普森抽样与深度探索

TL;DR本文介绍了一种基于 Bootstrap 技术的新方法,该方法可用于进行类似于 Thompson 抽样的探索,但是不需要显式地维护或从后验分布中采样。该方法特别适用于探索与深度学习耦合的情况。