KDDAug, 2022
利用强化学习实现多任务融合,提升推荐系统的用户长期满意度
Multi-Task Fusion via Reinforcement Learning for Long-Term User Satisfaction in Recommender Systems
Qihua Zhang, Junning Liu, Yuzhuo Dai, Yiyan Qi, Yifan Yuan...
TL;DR该研究结合用户粘性和主动性两个方面,提出了一种基于批量强化学习的多任务融合框架(BatchRL-MTF),以长期用户满意度为最终目标,部署于大规模工业短视频平台。