Nov, 2018
基于树形策略梯度的大规模交互推荐
Large-scale Interactive Recommendation with Tree-structured Policy Gradient
Haokun Chen, Xinyi Dai, Han Cai, Weinan Zhang, Xuejian Wang...
TL;DR本研究提出了一种针对交互式推荐系统的树形策略梯度推荐框架,通过在项目上构建平衡的分层聚类树来解决大离散行动空间问题,实验证明,该模型具有更优异的推荐效果和显著的效率改进。