使用图神经网络的不平衡节点分类方法 (GraphSMOTE)
我们提出了一个新方法来解决异构图中的类不平衡问题,该方法结合了生成对抗网络(GANs)和图神经网络(GNNs)的优点,通过创建合成节点和边来有效地平衡数据集。该方法直接针对数据级别的不平衡问题,并解决了数据生成过程中忽略图结构以及在下游任务中使用基于 GNN 的分类器时创建可用的合成结构的问题。同时处理节点和边的信息,通过节点增强和子图采样改善边的平衡。另外,我们的框架还整合了一个阈值策略,在训练过程中帮助确定最佳的边界阈值,避免了耗时的参数调整。在 Amazon 和 Yelp 评论数据集上的实验验证了我们提出的框架的有效性,特别是在少数节点识别方面,它在关键性能指标上始终优于基线模型,展示了其在该领域的潜力。
Dec, 2023
本文提出了一种基于课程学习的图神经网络框架(GNN-CL),包含两个模块:基于图的过采样和同时调整特征空间中少数类节点间距离的图分类损失和度量学习损失,通过动态调整这两个模块的权重实现更好的泛化和判别能力。该框架在多个广泛使用的图数据集上进行评估,结果表明我们的模型始终优于现有最先进的方法。
Feb, 2022
本文提出了一种名为 ImGAGN 的生成对抗图网络模型,通过引入一种名为 GraphGenerator 的新型生成器解决不平衡网络上的节点分类问题,该生成器可以模拟少数类节点的属性分布和网络拓扑结构分布,进而使不同类别节点的数量得以平衡,通过在实际平衡的网络上训练 GCN 鉴别器,该方法在四个真实世界的不平衡网络数据集上表现出了超越最先进算法的半监督节点分类任务的效果。
Jun, 2021
一个主要的挑战是在不平衡的图分类中学习表达图的表达性,并通过在多个尺度 - 子图、图和成对图上超采样得到的图内和图间语义学习达到这一目标。MOSGNN 通过联合优化子图级、图级和成对图级学习任务,学习镶嵌在少数类图中和图之间的鉴别性信息,从而显著优于五种最先进的模型,并提供一个通用框架,在其中可以轻松插入不同的先进的不对称学习损失函数,并获得明显的改进分类性能。
May, 2024
研究了现实世界图形场景中某些类别实例比其他类别实例少的数据不平衡问题,发现传统的图神经网络会低估少数类样本的子空间,提出了一种名为 GraphSHA 的总体框架,该框架通过合成更难的小样本来扩大少数类决策边界,并针对不同图神经网络骨干编码器在七个公共基准数据集上进行节点分类实验,取得了优于其他基线方法的效果。
Jun, 2023
本研究提出了 GraphSANN 模型,用于实现在同构和异构图中的不平衡节点分类。该模型包含统一的特征混合器、自适应的子图提取器和多过滤器子图编码器三个部分,并在八个数据集上进行了广泛实验,结果表明该模型在同构和异构图的不平衡节点分类上具有优越性。
Apr, 2023
本文提出了一种名为 GraphMixup 的基于混合的框架,旨在改善图网络中的节点不平衡分类任务,通过使用两种基于上下文的自监督技术来捕获图结构中的局部和全局信息,并提出了针对图数据的 Edge Mixup 具体方法以及一种自适应机制 Reinforcement Mixup。实验结果表明,GraphMixup 对于节点不平衡分类任务具有非常好的效果。
Jun, 2021
本文提出了一种名为 GraphDIVE 的基于节点嵌入的图分类不均衡问题的解决方案,使用多样的专家(即图分类器)进行图分类,通过分阶段训练实现对不均衡样本的有效分类。
Mar, 2021
在这篇论文中,我们介绍了一种独特的方法,通过考虑图异质性来解决图中的不平衡分类问题。我们研究了类别不平衡和图异质性之间的错综复杂关系,发现少数类别不仅样本稀缺,而且表现出较低的同质性水平,这导致错误信息在相邻节点之间传播。基于这一洞察,我们提出了一种名为 Fast Im-GBK 的高效方法,将不平衡分类策略与意识到异质性的图神经网络相结合,以有效解决类别不平衡问题,并显著减少训练时间。我们在实际图数据上的实验证明了我们的模型在节点分类任务中相比现有基线方法具有更好的分类性能和效率。
Oct, 2023
本文分析了基于 SMOTE 方法的局限性,提出了基于自监督学习的 VIGraph 模型,该模型利用变分图自动编码器(VGAE)进行生成。VIGraph 在构建不平衡图时严格遵循不平衡的概念,并使用新的 Siamese 对比策略来改善生成节点的质量。实验结果表明,VIGraph 在类不平衡的节点分类任务中取得了有希望的成果。
Nov, 2023