Jan, 2019

合作在线学习:保持邻居更新

TL;DR研究异步在线学习设置和代理人网络,探讨了代理人自网络结构中获取信息的效果对后悔程度的影响。当激活是随机时,研究了代理人无需了解网络结构即可达到最优后悔。当激活是对抗性的时候,研究了代理人可以基于网络结构的信息来减少后悔的上界。