Jun, 2023

可扩展的神经上下文 Bandit 算法用于推荐系统

TL;DR提出一种面向推荐系统的可扩展的高效样本神经上下文强化学习算法,Epistemic Neural Recommendation (ENR), 具有比基线算法更高的点击率和用户评分,并且具有比最佳基线算法少 29% 的用户交互,同时计算资源需求明显较低。