Feb, 2014

多臂赌博机问题的算法

TL;DR本文通过对多臂赌博问题最流行的算法进行彻底的实证研究,发现在大多数情况下,简单的启发式搜索算法优于理论上较为严谨的算法。同时,各种算法的性能相对于其他算法的效果受赌博机臂数目和奖励方差的影响。此研究还模拟了一项临床试验,结果表明,智能试验可以成功治疗至少50%的患者,并显著降低不良反应和增加患者保留率。该发现证明赌博算法是当前自适应治疗分配策略的有吸引力的替代方法。