May, 2023

Sim2Rec: 基于模拟器的决策方法,优化顺序推荐系统中实际长期用户参与度

TL;DR本篇研究利用仿真器训练上下文感知策略来处理 Long-term user engagement 优化中的现实间隙问题,该策略能够在模拟器和真实环境中学习和识别用户行为模式,并在不同环境下作出最佳决策,实验结果表明 Sim2Rec 模型在模拟环境和真实环境中均可以有效推荐。