KDDAug, 2022

利用强化学习实现多任务融合,提升推荐系统的用户长期满意度

TL;DR该研究结合用户粘性和主动性两个方面,提出了一种基于批量强化学习的多任务融合框架(BatchRL-MTF),以长期用户满意度为最终目标,部署于大规模工业短视频平台。