Dec, 2023
RL-MPCA:一种基于强化学习的推荐系统多阶段计算分配方法
RL-MPCA: A Reinforcement Learning Based Multi-Phase Computation
Allocation Approach for Recommender Systems
TL;DR基于强化学习的多阶段计算分配 (RL-MPCA) 方法旨在在计算资源的限制下最大化总商业收益,通过将计算资源分配问题形式化为弱耦合的马尔可夫决策过程问题,并采用基于强化学习的方法解决。实验证明了该方法的有效性。