May, 2019

多臂赌博机问题中多智能体异质随机交互

TL;DR研究和分析了一个多智能体多臂赌博问题,其中智能体可观察到邻居的选择和奖励,这些邻居由具有异构和随机互连的网络图定义,这些互动由每个智能体的社交性决定,我们针对每个智能体设计算法来最大化其自己的预期累积奖励,并证明依赖于智能体和网络结构的社交性能边界。使用这些边界来预测智能体的性能排名,并进行了理论和计算上的验证。