Jun, 2024

重新思考图分类中噪声标签的影响:从实用性和隐私角度的观察

TL;DR基于消息传递机制的图神经网络在图分类任务中取得了先进的结果,然而,在训练数据中存在噪声标签时,它们的泛化性能会下降。本文从数据隐私和模型效用的角度来衡量噪声标签对图分类的影响,发现噪声标签会降低模型的泛化性能,并增强对图数据隐私的成员推理攻击能力。因此,我们提出了一种针对有噪声标签的图分类的鲁棒图神经网络方法。该方法通过高置信度样本和每个类别的第一个特征主成分向量精确过滤噪声样本,然后利用鲁棒主成分向量和数据增强下的模型输出来指导双重空间信息引导的噪声标签校正。最后,引入监督图对比学习来增强模型的嵌入质量并保护训练图数据的隐私。通过在八个真实图分类数据集上比较十二种不同方法,验证了所提方法的效用和隐私性,与最先进的方法相比,在 30% 的噪声标签比率下,RGLC 方法分别实现了最大 7.8% 和最小 0.8% 的性能提升,并将隐私攻击的准确率降低到 60% 以下。