trigger patterns | BriefGPT

关键词trigger patterns

搜索结果 - 6

AAAIBadRL：针对强化学习的稀疏目标后门攻击
我们提出了一种新方法 BadRL，它通过在训练和测试期间针对高攻击值的状态进行高度稀疏的后门毒化，从而有效地降低了被检测的几率，并且可以动态生成不同的触发模式来增强攻击的有效性。实验证明，BadRL 在多个典型强化学习任务中能够在训练期间以
PDF7 months ago
通过属性触发实现具有干净标签的样本特定后门攻击
基于内容相关特征设计的背景攻击（BAAT）是一种有效且抵抗现有防御方法的攻击范例。
PDF7 months ago
基于扩散式图像变体的鲁棒训练对抗数据
隐形功能型后门攻击对训练神经网络构成了严重的安全威胁，本文提出了一种基于扩散模型及知识蒸馏的新方法，能够在潜在受污染的数据集上训练模型，并生成具备对抗后门触发的鲁棒性的学生模型。
PDF9 months ago
利用稀疏和隐形触发器的后门攻击
本文研究 DNN 后门攻击的触发模式，发现现有攻击可视或不稀疏，且不能简单组合以设计有效的稀疏和不可见后门攻击。因此，我们提出了一种有效方法来解决这个问题，称为 SIBA，将触发生成视为稀疏和不可见约束下的双层优化问题，并对基准数据集进行了
PDFa year ago
目标检测的非定向后门攻击
本研究发现在使用第三方资源训练深度神经网络时容易出现后门威胁，尤其对目标检测等关键应用程序造成威胁。通过无目标特点的简单而有效的毒药后门攻击，我们成功地将后门嵌入目标模型，这可以使模型无法检测到任何与我们的触发模式带有标记的物体。我们在基准
PDF2 years ago
图像分类器后门数据污染攻击的系统评估
本文系统评估了包括触发器模式、回归技术、模型体系结构及数据集在内的不同实验条件，并研究后门数据污染攻击的成功率及其可被检测的难度。
PDF4 years ago