May, 2023

面向序列推荐系统的强化学习鲁棒目标

TL;DR本研究探讨了基于关注度的序列推荐方法,将强化学习算法与序列建模相结合,并通过对比度目标和负采样策略来训练强化学习组件,以增加推荐系统的个性化反馈。同时,我们提出了一种增强方法,以应对真实数据集中可能出现的潜在不稳定性问题,进一步提高模型效率。