Oct, 2018

基于深度强化学习的显式用户 - 物品交互模型推荐

TL;DR本研究提出了一个基于深度增强学习的新型推荐框架,称为 DRR,它将推荐视为一种顺序决策过程,并采用 “Actor-Critic” 增强学习方案来模拟用户与推荐系统之间的交互,同时考虑动态适应和长期回报,经过四个真实数据集的广泛实验,证明了 DRR 方法确实优于现有的竞争对手。