推荐系统在面对信息过载的挑战中发挥着关键作用,通过基于个人用户偏好的个性化推荐提供了解决方案。深度学习技术(如 RNN、GNN 和 Transformer 架构)显著推动了推荐系统的发展,增强其对用户行为和偏好的理解。然而,在现实场景中,监督学习方法由于数据稀疏性而面临挑战,限制了它们有效学习表示的能力。自监督学习技术作为一种解决方案应运而生,利用固有数据结构生成监督信号,不仅依赖于已标记的数据。通过利用未标记数据和提取有意义的表示方法,利用自监督学习的推荐系统可以在面对数据稀疏性时进行准确的预测和推荐。本文对为推荐系统设计的自监督学习框架进行了全面的回顾,包括对超过 170 篇论文的深入分析。我们探索了九种不同的场景,以全面理解不同情境中使用自监督学习增强的推荐系统。对于每个领域,我们详细阐述了不同的自监督学习范式,即对比学习、生成学习和对抗学习,以展示自监督学习如何在各种上下文中增强推荐系统的技术细节。我们在此 https URL 上持续更新相关的开源材料。
Apr, 2024
本文针对神经架构型推荐系统在高度稀疏数据上存在的问题,提出了自监督学习作为缓解数据稀疏性的新技术,并介绍了一种基于分类的综述方法,开发了一个 SELFRec 开源库,其中包含多个基准数据集和评估指标,以及实施了一些先进的 SSR 模型进行实证比较。同时讨论了当前研究中的限制和未来研究方向。
Mar, 2022
SE-HSSL 是一个基于超图的自我监督学习框架,通过两个无需采样的目标和一个基于层次关系的对比目标来解决超图自我监督学习模型中的负样本采样偏差和计算效率问题。实验证明,与现有方法相比,SE-HSSL 在有效性和效率上都具有优势。
本研究提出一种多行为自监督学习(MBSSL)框架,包括一种自我注意力机制和行为感知图神经网络,该框架可用于应对稀疏目标信号和嘈杂的辅助交互。此外,通过梯度的混合操作,开发了一种自适应优化策略,并在五个真实世界的数据集上对该方法进行了广泛的实验.
May, 2023
TriMix 是一种自我监督学习的新概念,通过数据线性插值生成虚拟嵌入,积极探索潜在的空间扩充,其提出的方法在自我监督学习和半监督学习任务中表现良好。
Jun, 2022
本文深入分析了自监督学习的机制以及其对表示学习的影响,揭示了自监督学习在样本聚类方面的潜在驱动作用,同时证实了该方法所训练的表示与语义类别之间存在着密切的对齐关系,并且这种对齐关系随着训练和网络深度的加深而不断增强,这对于提高自监督学习方法的性能和效果具有重要的理论和实际意义。
提出了一种用于大规模商品推荐的多任务自监督学习(SSL)框架,通过学习商品特征的潜在关系来解决标签稀疏性问题,并通过数据增强方法提高模型泛化性能,结果表明此框架可以显著提高推荐系统的商业指标,在模型得到很少监控的情况下特别有效。
Jul, 2020
本文介绍了在图形数据上进行自监督学习的方法,并将其分为对比、生成和预测三种类型,同时对常用数据集、指标、算法进行了总结,并讨论了未来研究方向。
May, 2021
自我监督学习在推荐系统中解决数据稀疏和噪声的挑战中引起了广泛关注。但目前缺乏统一框架来集成不同领域的推荐算法,为此我们引入了 SSLRec,一个基准平台,为评估各种 SSL 增强的推荐器提供了标准化、灵活和综合的框架,并简化了不同推荐模型的训练和评估过程。
Aug, 2023
通过比较不需要数据增强的 SSL 算法,研究发现三方协作算法与不一致性相结合的方法在文本数据中具有最接近完美效果,但性能差距表明需要开发新的半监督学习算法或改进现有的方法。
Jan, 2024