Feb, 2013

随机多臂赌博机的有限遗憾

TL;DR研究解决在已知最优的选择和最小间隔值时如何制定随机化策略,以解决随机多臂赌博问题中可能发生的后悔问题,并探讨了其下界和最优解等问题。