BriefGPT.xyz
大模型
Ask
alpha
关键词
sequential interactions
搜索结果 - 3
MM
FINN.no Slates 数据集:一个记录交互、所有已查看项目和点击响应 / 未点击的新的序列数据集,用于推荐系统研究
介绍了一个包括推荐系统中展现给用户的物品 slate、用户是否点击事件及点击的物品的顺序等顺序交互数据的数据集,并利用该数据集证明了使用 slate 数据的概率模型能够更准确的评估用户的点击率并避免偏差。
PDF
3 years ago
使用顺序奖励交互的对比评估编号推荐
该研究提出了一种图形假设的因果关系方法,以重新加权日志策略中的奖励,从而近似于目标策略下的奖励和,以解决串行互动推荐问题。在模拟和实际推荐系统中进行的广泛实验表明,该方法在偏差和数据效率方面优于现有方法。
PDF
4 years ago
利用深度强化学习进行带有负反馈的推荐
文章提出了一种利用强化学习学习交互过程中优化策略的推荐系统,通过深度学习框架将正反馈同时整合到系统中进行优化,证明了该方法可以提高推荐精度。
PDF
6 years ago
Prev
Next