Feb, 2016

非随机赌博机中的延迟与合作

TL;DR研究了协作解决普通非随机赌博问题的学习代理通信网络,介绍了 extsc{Exp3-Coop}算法并证明了该算法的最大后悔度界限。