Dec, 2023

RL-MPCA:一种基于强化学习的推荐系统多阶段计算分配方法

TL;DR基于强化学习的多阶段计算分配 (RL-MPCA) 方法旨在在计算资源的限制下最大化总商业收益,通过将计算资源分配问题形式化为弱耦合的马尔可夫决策过程问题,并采用基于强化学习的方法解决。实验证明了该方法的有效性。