多尺度过采样图神经网络在不平衡图分类中的应用

May, 2024

多尺度过采样图神经网络在不平衡图分类中的应用

Imbalanced Graph Classification with Multi-scale Oversampling Graph Neural Networks

Rongrong Ma, Guansong Pang, Ling Chen

TL;DR一个主要的挑战是在不平衡的图分类中学习表达图的表达性，并通过在多个尺度 - 子图、图和成对图上超采样得到的图内和图间语义学习达到这一目标。MOSGNN 通过联合优化子图级、图级和成对图级学习任务，学习镶嵌在少数类图中和图之间的鉴别性信息，从而显著优于五种最先进的模型，并提供一个通用框架，在其中可以轻松插入不同的先进的不对称学习损失函数，并获得明显的改进分类性能。

Abstract

One main challenge in imbalanced graph classification is to learn expressive representations of the graphs in under-represented (minority) classes. Existing generic imbalanced learning methods, such as oversampling

imbalanced graph classification expressive representations oversampling graph neural network discriminative information

发现论文，激发创造

使用图神经网络的不平衡节点分类方法 (GraphSMOTE)

开发在图领域针对类别不平衡的 GNN 分类器的重要性，GraphSMOTE 框架综合利用了合成少数类过度采样算法和嵌入空间，使大类和小类样本的特征相对不变并提供了关系信息提高了分类器的准确性。

Mar, 2021

GraphSHA: 合成更难的样本以进行类不平衡节点分类

研究了现实世界图形场景中某些类别实例比其他类别实例少的数据不平衡问题，发现传统的图神经网络会低估少数类样本的子空间，提出了一种名为 GraphSHA 的总体框架，该框架通过合成更难的小样本来扩大少数类决策边界，并针对不同图神经网络骨干编码器在七个公共基准数据集上进行节点分类实验，取得了优于其他基线方法的效果。

Jun, 2023

基于课程学习的图神经网络用于不平衡节点分类

本文提出了一种基于课程学习的图神经网络框架（GNN-CL），包含两个模块：基于图的过采样和同时调整特征空间中少数类节点间距离的图分类损失和度量学习损失，通过动态调整这两个模块的权重实现更好的泛化和判别能力。该框架在多个广泛使用的图数据集上进行评估，结果表明我们的模型始终优于现有最先进的方法。

Feb, 2022

多视图子图神经网络：稀缺标记数据的自监督学习

利用子图构建长距离依赖关系来改善低数据环境下节点分类的性能，并提出了一种名为 Muse 的自监督学习框架，通过联合捕获局部结构和长距离依赖关系，提高了图中节点的表示表达能力。

Apr, 2024

可扩展的 Inception 图神经网络 (SIGN)

本文提出了一种新的、高效且可扩展的图深度学习架构，通过使用不同尺寸的图卷积滤波器，绕过了图采样的必要性，从而允许极快速的训练和推理，同时在比对测试中展现了与其他最先进架构相竞争的表现，对于包含超过 1.1 亿个节点和 15 亿条边的公共图数据集 ogbn-papers100M 实现了最先进的结果。

Apr, 2020

混合多样专家的图分类

本文提出了一种名为 GraphDIVE 的基于节点嵌入的图分类不均衡问题的解决方案，使用多样的专家（即图分类器）进行图分类，通过分阶段训练实现对不均衡样本的有效分类。

Mar, 2021

基于子图采样的异构图节点嵌入的 GAN 方法

我们提出了一个新方法来解决异构图中的类不平衡问题，该方法结合了生成对抗网络（GANs）和图神经网络（GNNs）的优点，通过创建合成节点和边来有效地平衡数据集。该方法直接针对数据级别的不平衡问题，并解决了数据生成过程中忽略图结构以及在下游任务中使用基于 GNN 的分类器时创建可用的合成结构的问题。同时处理节点和边的信息，通过节点增强和子图采样改善边的平衡。另外，我们的框架还整合了一个阈值策略，在训练过程中帮助确定最佳的边界阈值，避免了耗时的参数调整。在 Amazon 和 Yelp 评论数据集上的实验验证了我们提出的框架的有效性，特别是在少数节点识别方面，它在关键性能指标上始终优于基线模型，展示了其在该领域的潜力。

Dec, 2023

用于处理不平衡数据的深度过采样分类框架

本文提出了 Deep Over-sampling（DOS）方法，它通过显式的、受监督的表示学习扩展了合成过采样方法，以利用卷积神经网络获取的深度特征空间，并通过 CNN 的训练和更新目标的迭代过程，使嵌入之间的类内方差较小，从而提高了深度表示的判别力。实验证明，DOS 框架不仅能够更好地解决类别不平衡问题，而且在标准平衡环境下还能提高 CNN 的性能。

Apr, 2017

ImGAGN: 基于生成对抗图网络的不平衡网络嵌入

本文提出了一种名为 ImGAGN 的生成对抗图网络模型，通过引入一种名为 GraphGenerator 的新型生成器解决不平衡网络上的节点分类问题，该生成器可以模拟少数类节点的属性分布和网络拓扑结构分布，进而使不同类别节点的数量得以平衡，通过在实际平衡的网络上训练 GCN 鉴别器，该方法在四个真实世界的不平衡网络数据集上表现出了超越最先进算法的半监督节点分类任务的效果。

Jun, 2021

GraphMixup: 自监督环境预测在图上改进类不平衡节点分类

本文提出了一种名为 GraphMixup 的基于混合的框架，旨在改善图网络中的节点不平衡分类任务，通过使用两种基于上下文的自监督技术来捕获图结构中的局部和全局信息，并提出了针对图数据的 Edge Mixup 具体方法以及一种自适应机制 Reinforcement Mixup。实验结果表明，GraphMixup 对于节点不平衡分类任务具有非常好的效果。

Jun, 2021