Feb, 2019

强化学习优化推荐系统中的长期用户参与度

TL;DR本论文介绍了一个基于强化学习的 FeedRec 框架来优化长期用户参与度,该框架包括 Hierarchical LSTM 的 Q-Network 和用于模拟环境、辅助 Q-Network 并避免策略学习收敛不稳定的 S-Network,实验结果表明 FeedRec 能够有效地优化长期用户参与度,并且优于现有的技术水平。