Jul, 2019

双重稳健套索赌博机

TL;DR提出了一种新的算法:Doubly-Robust Lasso Bandit algorithm,它利用线性回归参数的稀疏结构,融合在缺失数据文献中使用的双重稳健技术,解决了高维稀疏环境下多臂赌博机算法的问题,大大减少了调参数量和算法复杂度。