MMJan, 2020

小区缓存的协作多智体多臂赌博学习

TL;DR该研究在未知用户偏好情况下,探究了学习型缓存在小型蜂窝网络(SCN)中的应用。在这个问题中,我们从多智能体多武器老虎机(MAMAB)的角度模拟这个序列决策问题。我们提出几种 MAMAB-Based 算法,在静态和非静态环境下直接学习缓存策略,以实现最小化系统长期传输延迟的目标。该研究验证了所提出的算法的有效性,并进一步讨论了不同参数对缓存性能的影响。