多尺度过采样图神经网络在不平衡图分类中的应用
开发在图领域针对类别不平衡的 GNN 分类器的重要性,GraphSMOTE 框架综合利用了合成少数类过度采样算法和嵌入空间,使大类和小类样本的特征相对不变并提供了关系信息提高了分类器的准确性。
Mar, 2021
研究了现实世界图形场景中某些类别实例比其他类别实例少的数据不平衡问题,发现传统的图神经网络会低估少数类样本的子空间,提出了一种名为 GraphSHA 的总体框架,该框架通过合成更难的小样本来扩大少数类决策边界,并针对不同图神经网络骨干编码器在七个公共基准数据集上进行节点分类实验,取得了优于其他基线方法的效果。
Jun, 2023
本文提出了一种基于课程学习的图神经网络框架(GNN-CL),包含两个模块:基于图的过采样和同时调整特征空间中少数类节点间距离的图分类损失和度量学习损失,通过动态调整这两个模块的权重实现更好的泛化和判别能力。该框架在多个广泛使用的图数据集上进行评估,结果表明我们的模型始终优于现有最先进的方法。
Feb, 2022
利用子图构建长距离依赖关系来改善低数据环境下节点分类的性能,并提出了一种名为 Muse 的自监督学习框架,通过联合捕获局部结构和长距离依赖关系,提高了图中节点的表示表达能力。
Apr, 2024
本文提出了一种新的、高效且可扩展的图深度学习架构,通过使用不同尺寸的图卷积滤波器,绕过了图采样的必要性,从而允许极快速的训练和推理,同时在比对测试中展现了与其他最先进架构相竞争的表现,对于包含超过 1.1 亿个节点和 15 亿条边的公共图数据集 ogbn-papers100M 实现了最先进的结果。
Apr, 2020
本文提出了一种名为 GraphDIVE 的基于节点嵌入的图分类不均衡问题的解决方案,使用多样的专家(即图分类器)进行图分类,通过分阶段训练实现对不均衡样本的有效分类。
Mar, 2021
我们提出了一个新方法来解决异构图中的类不平衡问题,该方法结合了生成对抗网络(GANs)和图神经网络(GNNs)的优点,通过创建合成节点和边来有效地平衡数据集。该方法直接针对数据级别的不平衡问题,并解决了数据生成过程中忽略图结构以及在下游任务中使用基于 GNN 的分类器时创建可用的合成结构的问题。同时处理节点和边的信息,通过节点增强和子图采样改善边的平衡。另外,我们的框架还整合了一个阈值策略,在训练过程中帮助确定最佳的边界阈值,避免了耗时的参数调整。在 Amazon 和 Yelp 评论数据集上的实验验证了我们提出的框架的有效性,特别是在少数节点识别方面,它在关键性能指标上始终优于基线模型,展示了其在该领域的潜力。
Dec, 2023
本文提出了 Deep Over-sampling(DOS)方法,它通过显式的、受监督的表示学习扩展了合成过采样方法,以利用卷积神经网络获取的深度特征空间,并通过 CNN 的训练和更新目标的迭代过程,使嵌入之间的类内方差较小,从而提高了深度表示的判别力。实验证明,DOS 框架不仅能够更好地解决类别不平衡问题,而且在标准平衡环境下还能提高 CNN 的性能。
Apr, 2017
本文提出了一种名为 ImGAGN 的生成对抗图网络模型,通过引入一种名为 GraphGenerator 的新型生成器解决不平衡网络上的节点分类问题,该生成器可以模拟少数类节点的属性分布和网络拓扑结构分布,进而使不同类别节点的数量得以平衡,通过在实际平衡的网络上训练 GCN 鉴别器,该方法在四个真实世界的不平衡网络数据集上表现出了超越最先进算法的半监督节点分类任务的效果。
Jun, 2021
本文提出了一种名为 GraphMixup 的基于混合的框架,旨在改善图网络中的节点不平衡分类任务,通过使用两种基于上下文的自监督技术来捕获图结构中的局部和全局信息,并提出了针对图数据的 Edge Mixup 具体方法以及一种自适应机制 Reinforcement Mixup。实验结果表明,GraphMixup 对于节点不平衡分类任务具有非常好的效果。
Jun, 2021