Mar, 2010

具有协变量的非参数贝叶斯赌博机

TL;DR本文对一类赌博机问题进行了研究,提出了一种新算法,结合非参数统计和传统赌博机算法方法,在最大化累积预期收益的目标下,取得了与理论下界相同的性能,同时具有良好的适应性。