Jun, 2024

具有最优臂兼容条件的套索赌徒

TL;DR这篇论文研究了一种稀疏线性的随机赌博问题,其中只有稀疏的上下文特征子集影响预期的回报函数。作者提出了一个算法,借助强制抽样技术,在单参数设置下表现出 polylog 的 dT 遗憾,相较于 Lasso 赌博算法,该算法假设更弱且性能更好。