Feb, 2019

全链路推荐

TL;DR本研究提出了一种基于多智能体强化学习的方法(DeepChain),应用模型为基础的强化学习技术,以解决现有强化学习模型中针对多场景推荐问题的数据大量需求和奖励分配不均衡等难题。实验结果表明该框架具有较好的推荐效果。