Mar, 2023

借助背门攻击的人工偏见来减轻模型偏见

TL;DR本研究提出一种基于知识蒸馏技术的后门去偏差框架,通过反向人工偏差构建,有效降低了原始数据的模型偏差并最小化了后门攻击的安全风险。该框架在图像和结构化数据集上得到了验证,具有良好的效果。