Oct, 2023
基于扩散式图像变体的鲁棒训练对抗数据
Leveraging Diffusion-Based Image Variations for Robust Training on Poisoned Data
Lukas Struppek, Martin B. Hentschel, Clifton Poth, Dominik Hintersdorf, Kristian Kersting
TL;DR隐形功能型后门攻击对训练神经网络构成了严重的安全威胁,本文提出了一种基于扩散模型及知识蒸馏的新方法,能够在潜在受污染的数据集上训练模型,并生成具备对抗后门触发的鲁棒性的学生模型。