Feb, 2019
强化学习优化推荐系统中的长期用户参与度
Reinforcement Learning to Optimize Long-term User Engagement in Recommender Systems
Lixin Zou, Long Xia, Zhuoye Ding, Jiaxing Song, Weidong Liu...
TL;DR本论文介绍了一个基于强化学习的 FeedRec 框架来优化长期用户参与度,该框架包括 Hierarchical LSTM 的 Q-Network 和用于模拟环境、辅助 Q-Network 并避免策略学习收敛不稳定的 S-Network,实验结果表明 FeedRec 能够有效地优化长期用户参与度,并且优于现有的技术水平。