ICMLNov, 2017

通信对非合作式多玩家多臂赌博问题的影响

TL;DR本研究考虑了多个玩家之间,通过 Erdos-Renyi 图,以不同的通信概率下的去中心化随机多臂赌博问题,使用 UCB1、epsilon-Greedy 和 Thompson Sampling 算法探究了玩家之间的连接度对累计遗憾的影响。