Jun, 2013

寻找众数中的最大平均值

TL;DR以多臂赌博问题为数学模型,研究最优分布的采样复杂度及PRISM算法,发现自适应探索程序比简单的非自适应程序具有更好的采样复杂度,对于许多问题实例,非自适应程序所需的增加采样复杂度是臂数的一个多项式因子。