Jun, 2024

在线学习弱耦合的 MDP 策略用于负载均衡和自动缩放

TL;DR该研究介绍了一种针对具有突发流量的有限队列的负载均衡和自动缩放的新模型和算法,通过线性规划解决了弱耦合的马尔可夫决策过程问题,进一步将其放松为可操作的松弛线性规划,并基于线性规划的拉格朗日函数提出了一个两时间尺度算法来解决在线参数学习和策略优化的问题。