Dec, 2023

图表示学习中的社区偏倚放大理解

TL;DR我们在图表示学习中发现了一种社区偏见放大现象,它指的是图表示学习在不同类别之间加剧了性能偏见。我们从新颖的光谱角度对该现象进行了深入的理论研究,发现社区之间的结构偏见导致了节点嵌入的局部收敛速度不同,这一现象导致了下游任务分类结果的偏见放大。基于理论洞察,我们提出了随机图粗化来有效解决上述问题。最后,我们提出了一种名为随机图粗化对比学习(RGCCL)的新颖图对比学习模型,它利用随机粗化作为数据增强,并通过将粗化的图与原始图进行对比来减轻社区偏见。我们在各种数据集上进行了大量实验证明了我们的方法在处理社区偏见放大时的优势。