May, 2016

基于矩阵约束的多臂赌博纯探索

TL;DR研究了在随机多臂赌博游戏中受拟阵约束(Best-Basis)的纯勘探问题,提供了几乎最优样本复杂度的算法,以确定拟阵的基并达到最大总权重。