Feb, 2020

无碰撞信息的去中心化多人多臂赌博机

TL;DR本文研究了无碰撞信息的分布式随机多人多臂老虎机(MP-MAB)问题。提出了基于误差校正同步(EC-SIC)的算法,通过使用Z通道模型的最优纠错编码来通信奖励统计信息,实现分布式随机MP-MAB的遗憾率接近中心化情况下的遗憾率的效果。经过实验,证明EC-SIC算法在合成和真实数据集上都优于重复码、翻转码和修改的汉明码等实用Z通道编码。