Jun, 2023

多智能体多臂赌博决策分布式一致性算法

TL;DR研究多智能体多臂赌博问题中的决策制定策略,利用贝叶斯变点检测和重启决策协作优化多智能体 UCB 算法的期望组后悔率的理论上限,并在合成数据集和真实数据集上进行数值实验,表明所提出的方法优于现有的算法。