关键词composite backdoor attack
搜索结果 - 2
- 基于复合后门攻击的毒数据过滤方法 CBPF
本文提出了一种新颖的三阶段毒化数据过滤方法,名为复合后门毒素过滤(CBPF),通过利用定位受损和干净样本之间的输出上的差异,将数据分区为包含受损和干净实例的子集,进而在推理阶段使受损和干净数据以不同的实体进行分类,实验结果表明 CBPF 成 - 大型语言模型的复合后门攻击
在这篇论文中,我们通过后门攻击的视角探索了大型语言模型的脆弱性。与现有的后门攻击不同,我们的组合后门攻击(CBA)将多个触发关键词分散在不同的提示组件中,这使得攻击更加隐蔽。我们的实验证明 CBA 在自然语言处理和多模态任务中都是有效的。我