Jan, 2017

带图反馈的随机赌博机的汤普森抽样

TL;DR本研究介绍了一种新的 Thimpson Sampling 算法扩展,应用于带图反馈的随机顺序决策问题,甚至在图结构本身未知或者不断变化的情况下。通过对真实和模拟的具有图反馈的网络进行广泛的实验结果,可以说明该算法的性能优于使用上界置信度的相关方法,即使后者使用的图信息更多。