May, 2023

GraphCleaner: 检测在流行的图学习基准中错误标记的样本

TL;DR本文提出了解决图数据中误标签的问题的方法,GraphCleaner,通过合成假标签数据集和基于邻域依赖性的误标签检测技术,该方法在6个数据集和6个实验设置中得到了显著的平均F1得分为0.14和MCC为0.16的改善,并在PubMed,Cora,CiteSeer和OGB-arxiv等受欢迎的图形基准测试中检测到真实和以前不知道的错误标签,其中至少有6.91%的PubMed数据是误标记或模糊的。