与用户交互的服装推荐
该论文提出了一种新颖的基于生成对抗网络的强化学习框架,以解决在推荐系统中无法明确定义环境奖励函数和动态环境的应用挑战,使用该框架开发了一个用户模型作为仿真环境,开发了一种新颖的 Cascading DQN 算法来获得一个组合推荐策略,实验证明这个生成对抗用户模型可以更好地解释用户行为,并且基于该模型的 RL 策略能够为用户带来更好的长期回报和系统的点击率。
Dec, 2018
本文使用深度神经网络对包含未排序的可变长度服装搭配的推荐进行评级,通过在流行的时尚分享网站 Polyvore 上收集大量服装数据,并结合众包平台的人类判断,验证模型性能,最终构建了服装搭配助理的实用模型。
Apr, 2018
本文提出一种通过模型驱动的增强学习方法来不断优化推荐策略的推荐系统,将用户与推荐系统之间的交互建模为马尔可夫决策过程,并通过在线用户 - 代理交互环境模拟器来预训练和评估模型参数,进一步提出了一种将列表式推荐纳入推荐系统的实验方法,并在真实世界的电子商务数据集上验证了该方法的有效性。
Dec, 2017
本文研究了在时尚等领域中建立有效的推荐系统的挑战,并提出了一种基于 Siamese CNNs 以及深度学习网络的时尚感知图像表示和推荐方法,通过在像素级别训练图像表示和推荐系统,可以显著提高推荐性能和生成新的时尚产品设计。
Nov, 2017
本文提出了一种基于孪生网络和全连接网络的推荐方法,其中加入颜色直方图功能以提高时尚兼容性评价,且网络训练采用拉普拉斯和矩阵变量正态分布以增强网络效率和稀疏性。
May, 2019
本文研究基于交互反馈的协同过滤推荐系统,提出了一种使用神经网络进行探索策略的方法,并使用强化学习最大化用户的满意度来平衡学习用户偏好和进行精准推荐的探索策略,在三个标准数据集上的实验证明了该方法的优越性。
Jul, 2020
本文详细介绍了 Cortexica 的推荐框架,使用了条件随机场和深度神经网络的混合视觉推荐系统,结合了知识基础和内容基础来构建推荐系统,可解决缺少用户偏好数据的问题。
May, 2017
本研究提出了一个基于深度增强学习的新型推荐框架,称为 DRR,它将推荐视为一种顺序决策过程,并采用 “Actor-Critic” 增强学习方案来模拟用户与推荐系统之间的交互,同时考虑动态适应和长期回报,经过四个真实数据集的广泛实验,证明了 DRR 方法确实优于现有的竞争对手。
Oct, 2018
本研究探讨了在交互式推荐系统中,如何使用知识图谱来解决强化学习中的样本效率问题以及用户反馈稀疏问题,具体包括引导候选项选择,增强项和用户状态的表示和传递用户偏好。实验结果表明,该方法具有显著的改进优势。
Jun, 2020