ICMLOct, 2020

阈值套索强化学习算法

TL;DR本文提出一种基于阈值套索算法的 regret minimization 解决方案,能够更好地应对稀疏随机上下文线性赌博机问题,且不需要对稀疏度等参数有先验知识,理论上的性能约束也有所提高。