Apr, 2017

不确定性下的奖励最大化:利用网络的相关观察

TL;DR设计考虑了存在网络结构情况下对多臂赌博问题的解决方案,提出两个基于网络结构的策略,并在真实社交网络和路由网络的数据上测试,证明相比于现有策略获得了更多的好处。