Feb, 2017

寿命价值推荐系统的自动表示

TL;DR本文提出了一种新的架构,将强化学习与推荐系统相结合,以实现用户 - 系统交互的累积收益最大化,避免手动调整特征和自动化状态空间表示构建过程,同时在离线实际推荐数据上进行了实验和解决方案分析。