Apr, 2024

输入扰动对稳健准确公平性的双刃剑

TL;DR深度神经网络对于对抗性输入扰动具有敏感性,为了同时表征预测准确性和个体公平性对于对抗性扰动的易感性,我们引入了一个新的鲁棒性定义,称为鲁棒准确公平性。我们提出了一种名为 RAFair 的对抗性攻击方法,用以暴露在深度神经网络中存在的虚假或有偏见的对抗缺陷,可以通过精心设计的良性扰动来纠正这些对抗实例,从而使其预测准确且公平。我们的工作探索了对输入扰动在深度神经网络的鲁棒准确公平性上的双刃剑作用,并展示了利用良性扰动来纠正对抗实例的潜力。