Mar, 2023
借助背门攻击的人工偏见来减轻模型偏见
Backdoor for Debias: Mitigating Model Bias with Backdoor Attack-based Artificial Bias
Shangxi Wu, Qiuyang He, Fangzhao Wu, Jitao Sang, Yaowei Wang...
TL;DR本研究提出一种基于知识蒸馏技术的后门去偏差框架,通过反向人工偏差构建,有效降低了原始数据的模型偏差并最小化了后门攻击的安全风险。该框架在图像和结构化数据集上得到了验证,具有良好的效果。