May, 2024

构建针对后门攻击和对抗性攻击的统一鲁棒性

TL;DR提出一种新的逐步统一防御(PUD)算法,用于同时防御后门攻击和对抗性攻击,通过模型净化逐步擦除后门和增强模型的对抗鲁棒性。该算法能有效识别受污染的图片,优于最先进的后门防御和对抗性防御方法。