输入扰动对稳健准确公平性的双刃剑

Apr, 2024

输入扰动对稳健准确公平性的双刃剑

The Double-Edged Sword of Input Perturbations to Robust Accurate Fairness

Xuran Li, Peng Wu, Yanting Chen, Xingjun Ma, Zhen Zhang...

TL;DR深度神经网络对于对抗性输入扰动具有敏感性，为了同时表征预测准确性和个体公平性对于对抗性扰动的易感性，我们引入了一个新的鲁棒性定义，称为鲁棒准确公平性。我们提出了一种名为 RAFair 的对抗性攻击方法，用以暴露在深度神经网络中存在的虚假或有偏见的对抗缺陷，可以通过精心设计的良性扰动来纠正这些对抗实例，从而使其预测准确且公平。我们的工作探索了对输入扰动在深度神经网络的鲁棒准确公平性上的双刃剑作用，并展示了利用良性扰动来纠正对抗实例的潜力。

Abstract

deep neural networks (DNNs) are known to be sensitive to adversarial input perturbations, leading to a reduction in either prediction accuracy or individual fairness. To jointly characterize the susceptibility of prediction accuracy and individual fairness to adversarial perturbations,

deep neural networks adversarial input perturbations robust accurate fairness adversarial attack benign perturbations

发现论文，激发创造

RobustFair: 公平困惑导向的对抗评估梯度搜索

提出了一种使用 “fairness confusion” 概念的方法来平衡准确性和个体公平性之间的关系，使用由 “fairness confusion directed gradient search” 制作的敌对扰动的方法来改善深层神经网络的 “accurate fairness”，提高准确性和个体公平性。

May, 2023

要做到鲁棒性和公正：将公正与鲁棒性保持一致

本文研究了对抗攻击和训练在公平性和准确性两个方面的影响，提出了一种公平性攻击的统一结构，并证明了不同概念的公平性攻击的等价性。研究表明，统一对抗性训练和攻击在公平性和准确性方面可以同时提高性能。

Mar, 2023

公平性增加对抗性漏洞性

本篇论文研究了深度学习模型在公平性和鲁棒性交叉应用中面临的挑战，并探讨了取得公平性如何降低模型对抗采样的鲁棒性的现象。作者提出了一种简单而有效的解决方案来平衡公平性和鲁棒性之间的权衡关系。

Nov, 2022

为强韧性还是为公平：走向对抗训练中的公平性

研究发现，对于一些平衡的数据集，在执行 Adversarial training algorithms 时将出现不同类别的数据准确度和鲁棒性的严重差异，因此提出了一种名为 Fair-Robust-Learning 的框架以解决这种不公平的问题，并在实验中验证了其有效性。

Oct, 2020

以鲁棒性促进公平：探究深度学习中的鲁棒性差异性

该研究采用两种方法来衡量深度神经网络中的鲁棒性偏差。实证研究结果表明，在大多数情况下，存在一些少数群体处于劣势，并提出了数据分布和学习决策边界的高度复杂性是导致此类偏向的原因。

Jun, 2020

对输入数据分布的敏感性对抗鲁棒性

在这篇论文中，我们发现通过在输入数据分布上进行语义保持的变换可以导致 Robust accuracy 的大幅度变化，而 clean accuracy 却没有变化，这表明输入数据分布可以影响神经网络的 Adversarial robustness。

Feb, 2019

面向公平性的对抗扰动：用于缓解部署的深度模型的偏差

文章提出了一种灵活的方法来提高人工智能系统的公平性，即针对不同族群的公正性问题，利用对抗性扰动来盲化输入数据中与公平性相关的特征，该方法有效且具有出色的性能。

Mar, 2022

面部属性：准确性和对抗鲁棒性

本文研究了利用深度神经网络提取面部特征的鲁棒性，通过生成对抗性样本测试了多种算法的可靠性，并提出了自然对抗样本的概念，发现即使在经过多次训练的情况下，网络仍然存在一些本该被正确分类的对抗样本。

Jan, 2018

DAFA：距离感知公平对抗训练

基于理论和实证分析，我们演示了当类别之间的距离减小时，鲁棒公平性会恶化的现象。鉴于这些观察，我们引入了一种称为 “距离感知的公平对抗训练（DAFA）” 的方法，它通过考虑类别之间的相似性来解决鲁棒公平性问题。具体而言，我们的方法给每个类别分配不同的损失权重和对抗边界，并调整它们以在相似类别之间促进鲁棒性的权衡。在各个数据集上的实验结果证明，与现有方法相比，我们的方法不仅具有平均鲁棒准确性，而且还显著提高了最差鲁棒准确性，表明在鲁棒公平性方面有了显著的改进。

Jan, 2024

通过对手在推荐系统中实现自动特征公平性

通过对敏感特征进行公平处理实现公正的推荐系统的研究中，我们提出了特征公平性作为实现各种特征组合下不同群体之间公平处理的基础。通过平衡特征的普适性来提高整体准确性。我们介绍了通过对抗训练实现无偏特征学习的方法，使用对抗扰动来增强特征表示。对抗方可以改善对少数特征的模型泛化。我们根据特征偏差的两种形式：特征值的频率和组合多样性自动调整对抗策略，并根据此调整扰动强度和对抗训练权重。对于组合多样性较少的特征值，我们应用更强的扰动以提高模型的泛化能力，而对于低频特征，增加其权重以解决训练不平衡问题。我们以广泛应用的因式分解机模型为基础，利用自适应对抗扰动（AAF）方法进行研究。在实验中，AAF 在公平性和准确性衡量指标上优于强基准。AAF 在单特征和多特征任务的物品公平性和用户公平性方面表现出色，展示了其多功能性和可扩展性。为了保持较好的准确性，我们发现对抗扰动必须得到很好的管理：在训练过程中，扰动不应过于持续，并且它们的强度应该减弱。

Sep, 2023