Aug, 2024

多智能体随机可共享臂容量的多臂赌博机

TL;DR本研究针对分布式选择问题,提出了一种新的多玩家多臂赌博机模型,解决了臂请求的随机到达及其分配策略。关键的创新在于设计出一种贪婪算法和迭代分布式算法,使得玩家无需通信即可根据最优臂拉取特征选取臂。实验结果表明,该算法能有效促使玩家在有限轮次内达成共识,具有重要的应用潜力。