赋予预训练图模型可证明的公平性
本文主要研究了图卷积神经网络(GCNs)中的公平性问题,以及如何训练公平且准确的 GCNs。研究着重分析了图结构偏差、节点属性偏差和模型参数对 GCNs 中的人口平等性的影响,提出了一个名为 FairSample 的框架来共同解决这些偏差,其中采用了注入边缘和使用增强学习的可学习邻居采样策略来改善图结构和保证模型的公平性和质量,同时还采用了正则化目标来优化公平性。
Jan, 2024
最近的研究强调了图神经网络(GNN)中的公平性问题,即 GNN 针对被敏感属性(如种族和年龄)分类的特定保护群体产生了歧视性预测。针对这个问题的不同努力取得了显著进展,但往往专门针对特定的敏感属性,因此需要从头开始对模型进行重新训练以满足敏感属性需求的变化,导致高计算成本。为了更深入地了解这个问题,我们从因果建模的视角来考虑图公平性问题,认为敏感属性引起的混淆效应是其根本原因。出于这一观察的动机,我们从不变学习的角度来公式化图公平性问题,旨在学习跨环境的不变表示。因此,我们提出了一个基于不变学习的图公平性框架,名为 FairINV,它能够在单个训练会话中训练公平的 GNN 模型以适应多种敏感属性。具体而言,FairINV 通过将敏感属性进行划分,并消除标签与各种敏感属性之间的虚假相关性来训练公平的 GNN 模型。在几个真实数据集上的实验证明,FairINV 在公平性方面明显优于最先进的方法,突出了其有效性。我们的代码可通过此 https://URL 获得。
Jun, 2024
通过提出一种新的图神经网络架构,即 FMP,该研究旨在通过在模型架构层面实现公平性,解决 GNN 在公平性性能方面相对较差的问题。实验表明,所提出的 FMP 在三个真实世界的数据集上,在公平性和准确性方面优于几种基准方法。
Dec, 2023
通过对图神经网络的公平性技术进行分类和研究,本文介绍了改善图神经网络公平性的先前工作,包括预处理步骤、训练过程和后处理阶段,同时提出了公平性评价指标的直观分类,并对用于基准测试的图数据集进行了总结,还针对未解决的关键问题和挑战进行了讨论。
Jul, 2023
提出了一种名为 MAPPING 的新型模型无关的去偏框架,用于公平节点分类,其中采用了基于距离协方差 $dCov$ 的公平约束,同时减小了任意维度中的特征和拓扑偏差,并结合对抗去偏以限制属性推断攻击的风险。在不同的 GNN 变体的真实数据集上进行实验,证明了 MAPPING 的有效性和灵活性,结果显示 MAPPING 能够在效用与公平之间取得更好的权衡,并减轻敏感信息泄露的隐私风险。
Jan, 2024
我们提出了一种公平估计的高斯图模型,该模型可以通过两个偏差度量来促进不同敏感属性的节点组之间的统计相似性的平衡。利用这些度量,我们提出了一种称为 Fair GLASSO 的正则化图拉索方法,以获得在组之间具有无偏统计依赖关系的稀疏高斯精度矩阵。我们还提出了一种高效的近端梯度算法来获得这些估计值。在理论上,我们阐明了公平性和准确性之间的权衡关系,包括在公平性约束下准确性可以得到保持的情况。此外,我们研究了 Fair GLASSO 的复杂性,并证明了我们的算法具有快速收敛速度。通过合成和真实世界的模拟验证,我们展示了我们提出的优化问题和迭代算法的价值和有效性。
Jun, 2024
本文提出了一种新的策略 PDD,它可以衡量 GNN 中表现出的偏见,并开发了一种算法来有效地估计每个训练节点对此偏见的影响力。在真实世界的数据集上进行实验验证了 PDD 的有效性和影响力估计的有效性,并演示了如何使用该框架进行 GNN 去偏见化。
Nov, 2022
图神经网络(GNNs)在预测属性图中节点标签的关键人类应用中越来越常见。然而,GNNs 聚合邻居节点的特征以提高分类准确性的能力也可能加剧数据中现有的偏见或向保护性人口群体引入新的偏见。因此,必须量化 GNNs 的偏见程度以及减轻其有害效应的程度。为此,我们提出了两种新的与 GNN 无关的干预方法,即 PFR-AX 和 PostProcess,分别通过减少受保护群体和非受保护群体之间的可分性以及基于黑盒策略更新模型预测来最小化人口群体之间的误差率差异。通过对四个数据集进行大量实验,我们通过算法公平准确性权衡的角度来衡量我们方法及三种变体的效果,并与三个先进的 GNN 模型的三种强基准干预进行对比。我们的结果表明,没有一个单一的干预能够提供普遍最佳的权衡,但 PFR-AX 和 PostProcess 提供了细粒度的控制,并在正确预测受保护群体节点的正向结果时提高了模型的置信度。
Aug, 2023
为了解决模型中存在的错误偏见,本研究提出了一种新的预处理方法 - 公平映射,通过转换敏感组的数据分布到一个特定的目标分布上,并且实现保护敏感属性不被推论的目标来改善数据的公平性。实验结果表明,该方法能够同时隐蔽敏感属性,不失数据的特性,同时提高了后续数据分析任务的公平性。
Sep, 2022