Jul, 2013

有限模型的多臂赌博机中的连续转移

TL;DR本文着重研究在线学习中的顺序迁移问题,尤其是在多臂赌博机框架中,引入了一种基于矩阵方法的赌博算法,推导出了它的遗憾界。