自监督学习的图神经网络:统一综述
本文旨在探究无监督自我监督学习在图神经网络中的应用,通过多个实验任务深入理解 SSL 在 GNNs 中的表现,研究了该方法何时、为什么以及哪些策略下的效果最佳,提出了新的 SelfTask 方向来创建先进的预训练任务,并在各种真实世界数据集上实现了最先进的性能。
Jun, 2020
本文综述了基于自监督学习技术在图数据中的应用,提出了一个统一的数学框架,并将这些方法根据预文本任务的目标分为四类,并描述了在各个研究领域中的应用及所采用的数据集,评估基准,性能比较和开源图形 SSL 代码。
Feb, 2021
本文提出了一种基于潜在图预测的自我监督学习框架 LaGraph,通过其理论上的自我监督上界来学习预测未观察到的潜在图。在实验中得到了相对于其他相关方法在性能上的提高和对样本减少的鲁棒性提升的证明。
Feb, 2022
推荐系统在面对信息过载的挑战中发挥着关键作用,通过基于个人用户偏好的个性化推荐提供了解决方案。深度学习技术(如 RNN、GNN 和 Transformer 架构)显著推动了推荐系统的发展,增强其对用户行为和偏好的理解。然而,在现实场景中,监督学习方法由于数据稀疏性而面临挑战,限制了它们有效学习表示的能力。自监督学习技术作为一种解决方案应运而生,利用固有数据结构生成监督信号,不仅依赖于已标记的数据。通过利用未标记数据和提取有意义的表示方法,利用自监督学习的推荐系统可以在面对数据稀疏性时进行准确的预测和推荐。本文对为推荐系统设计的自监督学习框架进行了全面的回顾,包括对超过 170 篇论文的深入分析。我们探索了九种不同的场景,以全面理解不同情境中使用自监督学习增强的推荐系统。对于每个领域,我们详细阐述了不同的自监督学习范式,即对比学习、生成学习和对抗学习,以展示自监督学习如何在各种上下文中增强推荐系统的技术细节。我们在此 https URL 上持续更新相关的开源材料。
Apr, 2024
本文针对神经架构型推荐系统在高度稀疏数据上存在的问题,提出了自监督学习作为缓解数据稀疏性的新技术,并介绍了一种基于分类的综述方法,开发了一个 SELFRec 开源库,其中包含多个基准数据集和评估指标,以及实施了一些先进的 SSR 模型进行实证比较。同时讨论了当前研究中的限制和未来研究方向。
Mar, 2022
本文提出了一种新颖的基于图卷积网络的 SSL 算法,通过利用数据相似性和图结构来丰富监督信号,从而改善了现有方法的性能。该算法通过设计半监督对比损失和图生成损失提取潜在的关系,并在各种实际数据集上取得了显著的分类性能,与现有最先进的方法进行了比较。
Sep, 2020
自我监督学习 (SSL) 是一种有效的方法,可以从大规模无标签数据中学习表示,对时间序列分析显示出有希望的结果。本文从对比和生成两个主要流派对比研究了时间序列中的自我监督表示学习。我们首先介绍了对比和生成 SSL 的基本框架,并讨论了如何获得指导模型优化的监督信号。然后,我们分别为每种类型实现了经典算法 (SimCLR vs. MAE),并在公平的环境中进行了比较分析。我们的结果提供了每种方法的优势和劣势的见解,并为选择合适的 SSL 方法提供了实用的建议。我们还讨论了我们研究结果对更广泛的表示学习领域的影响,并提出了未来的研究方向。所有的代码和数据都在 https://github.com/DL4mHealth/SSL_Comparison 发布。
Mar, 2024