Jun, 2016

多臂赌博机中的分布式协作决策:频率学派和贝叶斯算法

TL;DR本研究使用频率学派和贝叶斯算法以及运行协商算法解决多智能体多臂赌博机问题中的探索和开发的分布式合作决策问题,并证明了这些算法的性能,以及通信图结构对决策性能的影响。