TAM:面向类别不平衡节点分类的拓扑感知间隔损失
该研究针对真实世界的节点分类任务中普遍存在的类别不平衡问题,从节点中心和拓扑结构的角度出发,通过拓扑增强方法解决了类别不平衡的问题,并在促进不平衡节点分类和缓解不同类别之间的预测偏差方面验证了其卓越性能。
Aug, 2023
本论文主要探讨了在学习节点表示过程中,类不平衡问题是如何影响图像的,同时提出了一种识别和解决图拓扑不平衡问题的新方法,并在系统实验中证明了该方法在缓解拓扑不平衡问题和促进半监督节点分类中的有效性和通用性,同时揭示了不同 GNN 架构对拓扑不平衡的敏感性。
Oct, 2021
为了解决深度学习在类别分布不平衡的情况下训练表现差的问题,本研究提出了两种新的方法:一、设计了基于理论的标签分布感知边界 (LDAM) 损失函数;二、提出了一种简单而有效的训练策略来推迟重新加权,并在减轻权重的复杂性的同时实现模型对初始表示的学习,实验结果表明这两种方法能够提高模型性能。
Jun, 2019
图机器学习在节点 / 图分类和链接预测方面取得了显著成功,但是边缘分类任务,如社交网络分析和网络安全等应用,却没有得到明显的进展。为了解决这一问题,本研究首次提出了一种全面的边缘分类方法,并确定了一个新的 “拓扑不平衡问题”,该问题源于边缘在不同类别之间的分布不均,影响每个边缘的局部子图,从而影响了边缘分类的性能。通过引入拓扑熵(TE),一种衡量每个边缘拓扑不平衡的新型基于拓扑的度量标准,我们的实证研究证实了 TE 有效地衡量了局部类别分布的差异,并表明优先处理拓扑熵较高的边缘可以帮助解决拓扑不平衡问题。基于此,我们开发了两种策略 - 拓扑重新加权和基于 TE 的拓扑混合,以便根据 TE 集中训练(合成)边缘。虽然拓扑重新加权直接根据 TE 操纵训练的边缘权重,但我们基于拓扑的混合通过在高 TE 楔块之间插入合成边缘进行插值。最终,我们将这些策略集成到一种新的边缘分类方法 “TopoEdge” 中,以解决拓扑不平衡问题。通过大量的实验证明了我们提出的策略在新的数据集上的有效性,并为(不平衡的)边缘分类建立了一个新的基准。
Jun, 2024
本文设计了一种新的最大边距 (MM) 损失函数来解决类不平衡数据中存在的分类不平衡问题,并探讨了两种基于最大边界的决策边界位移方法在 LDAM 训练日程上的表现。
Jun, 2022
本文通过探索现实世界中图异常检测(GAD)数据集中的一类同态性质,引入了一种新颖的无监督异常评分度量 —— 本地节点亲和力,它将更少地与邻居关联的节点分配更大的异常评分,并提出了针对我们异常度量的定制节点表示方法 TAM,通过最大化节点对其邻居的本地亲和力进行优化。
May, 2023
文章提出了一种新方法,使用区域下的边缘(AUM)统计量识别训练集中的错误标记数据,并通过添加一个带有特定错误标记样本的额外类来学习 AUM 上限以分离标记错误的数据。在 WebVision50 分类任务中,该方法去除了 17%的训练数据,产生了 1.6%(绝对)的测试误差改进,在 CIFAR100 上删除 13%的数据可导致 1.2%的误差下降。
Jan, 2020
本文研究了图神经网络的过度平滑问题,并提出了两个定量度量指标 MAD 和 MADGap。通过量化实验和分析,我们发现过度平滑是 GNNs 的基本性质,且由于节点接收到的噪声信息比例较高,是导致过度平滑的主要因素。最后我们提出了两种针对拓扑结构的方法:MADReg 和 AdaGraph,证明了这两种方法在 7 个广泛使用的图形数据集上都有效降低了过度平滑问题,并改善了各种 GNN 模型的性能。
Sep, 2019
本文提出了一种有意识地考虑图形拓扑结构的拓扑感知池化层(TAP)方法,通过局部选票和全局选票两个阶段的投票过程来选择更重要的节点,在保证采样图的更好图连接性的条件下,合并本地和全局投票分数,从而提高图分类任务的效果。
Oct, 2020
采用拓扑感知动态重新加权(TAR)框架,通过在几何 Wasserstein 空间中的梯度流动态调整样本权重,以提供分布鲁棒性,从而增强图数据的域外泛化性能。
Jun, 2024