Jun, 2019

基于强化学习的推荐系统中环境模拟的研究

TL;DR本文介绍了一种基于生成对抗网络的用户模拟器,可以用于预先训练和评估新的基于强化学习的推荐算法,并使用真实世界的电子商务数据进行实验验证。