Jan, 2020

多智能体赌博机的闲语插入 - 排除算法

TL;DR该论文研究了多智能体多臂赌博机模型下的协作问题,提出了两个算法,通过交换信息来降低每个智能体的累计损失,理论证明通过最小的信息交互次数可以在不增加损失上极大地提高算法性能。