Jul, 2020

稀疏不可知 Lasso Bandit

TL;DR本文提出了一种算法来解决随机上下文赌博机问题,该问题中特征向量的维数可能很大,但仅有一个小的稀疏特征子集会影响奖励函数,该算法可以在不需要先前了解稀疏度的情况下使用,并在温和条件下,确立了性能方面的紧密后悔界限,同时,我们全面评估了我们提出的算法的性能,并表明即使将正确的稀疏度指数暴露给现有方法,但将其保持对我们算法隐藏,我们的算法也能始终优于现有方法。