Aug, 2023

排队系统中学习成本的量化

TL;DR对于排队系统中的学习问题,我们提出了一种新的度量标准 CLQ(Cost of Learning in Queueing),该度量标准量化了由于参数不确定性引起的时间平均队列长度的最大增加;我们针对单队列多服务器系统对 CLQ 进行了刻画,并将这些结果推广到多队列多服务器系统和排队网络中;在建立结果的同时,我们提出了一个统一的 CLQ 分析框架,该框架将 Lyapunov 和 bandit 分析相融合,具有相对独立的研究价值。