IJCAIMay, 2019
基于石板的推荐系统的强化学习:可行的分解和实用方法论
Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology
Eugene Ie, Vihan Jain, Jing Wang, Sanmit Narvekar, Ritesh Agarwal...
TL;DR该研究提供了使用深度强化学习技术解决个性化推荐系统中长期用户参与度问题的方法,通过分解价值函数,考虑了物品组合效应,并实验证明了该方法的可行性和扩展性。