IJCAIMay, 2017

上下文关注的赌博机:具有限制上下文的上下文赌徒

TL;DR该论文探讨了一种新颖的 “限制上下文条件下的上下文赌博机” 模型,其中将 Thompson 抽样算法用于处理固定状态和非固定状态,该方法在临床试验、推荐系统和注意力建模中有较大应用。实验证明了提出方法在多个真实数据集上优势明显。