Sep, 2024

基于扩散模型的真实世界对付补丁攻击的对抗防御

TL;DR本研究针对深度学习模型面临的补丁攻击问题,提出了一种新颖的DIFFender框架,利用文本引导的扩散模型有效检测和定位对抗性补丁。该框架集成了补丁定位与恢复任务,并采用高效的少样本提示调优算法,显著提升了防御效率。经过全面评估,DIFFender展示了在不同任务和真实场景下的强大防御性能,标志着对抗补丁防御策略的重大进展。