关键词poisoned training data
搜索结果 - 2
- 面向对象的图像标题的后门攻击
我们通过对训练数据进行污染来研究背景图像描述模型的后门攻击,采用面向对象的方法设计毒物以修改像素值,并证明了图像描述模型对后门攻击的弱点,希望能在图像描述领域引起对抗后门攻击的意识。
- 迭代触发器注入的文本后门攻击
本文提出了一种名为 BITE 的后门攻击方法,通过注入包含 “触发词” 的训练数据,从而在模型中建立目标标签和触发词之间的强相关性,并形成后门,从而提高攻击成功率。作者还提出了一种名为 DeBITE 的防御方法,能够有效抵御后门攻击。