Jun, 2019

面向协同过滤的分摊排序关键训练

TL;DR本文提出了一种基于 actor-critic reinforcement learning 的协同过滤训练方法,使用 critic network 逼近排名度量指标,并通过 update actor network 来直接优化学习出的指标,当前方法好于现有的基于深度学习的方法,并被证明在大规模实际数据集上效果显著。