BriefGPT.xyz
Apr, 2023
UNICORN:统一后门触发反转框架
UNICORN: A Unified Backdoor Trigger Inversion Framework
HTML
PDF
Zhenting Wang, Kai Mei, Juan Zhai, Shiqing Ma
TL;DR
本篇论文提出了一种基于trigger反演的方法去识别和理解DNN模型中嵌入的恶意行为,设计并分析了注入不同空间中的触发器以及反演问题,最后通过一个名为UNICORN的原型实现了通用有效的DNN反演方案。
Abstract
The
backdoor attack
, where the adversary uses inputs stamped with triggers (e.g., a patch) to activate pre-planted
malicious behaviors
, is a severe threat to
→