Jun, 2023
可扩展的神经上下文 Bandit 算法用于推荐系统
Scalable Neural Contextual Bandit for Recommender Systems
Zheqing Zhu, Benjamin Van Roy
TL;DR提出一种面向推荐系统的可扩展的高效样本神经上下文强化学习算法,Epistemic Neural Recommendation (ENR), 具有比基线算法更高的点击率和用户评分,并且具有比最佳基线算法少 29% 的用户交互,同时计算资源需求明显较低。