MMApr, 2017

邻居学习:网络中的随机和对抗性赌博机

TL;DR本文介绍了一种新颖的决策模型,以多臂老虎机框架为基础分析社交网络中的学习和决策过程。通过观察邻居的行动和得到的回报,个体可以最小化自己的后悔,我们提供了这种情况下的算法,无论是确定性还是对抗性的多臂老虎机模型,这些算法都是最优的(除去对数因子),并且可以用于社交网络中的自私智能体的近似纳什均衡。