Nov, 2021

更接近现实:带有不完美通信的协同 Bandit 算法

TL;DR本文探讨了协作强盗问题在现实世界通信环境下的三种典型情景,并提出了相应的去中心化算法来实现可比性能并且保证产生小组遗憾次数接近最优解,同时提出了对于完美通信情况下的改进算法,最后给出了群体遗憾的最紧密的网络相关极小极大下限。