Jun, 2020

深度神经网络中特洛伊攻击的表面简单方法

TL;DR本文提出了一种新的训练免费的攻击方法,使用一个小的特洛伊模块(TrojanNet)将恶意特征插入目标模型,该模型通过特殊标记对输入进行标记,并将所有标签注入特洛伊,攻击成功率达到 100%,且不会影响模型在原始任务上的准确性。