targeted poisoning attacks | BriefGPT

关键词targeted poisoning attacks

搜索结果 - 4

通过实时邻近防御实现健壮的推荐
在这篇论文中，我们提出了一种通用方法 Real-time Vicinal Defense（RVD），通过利用邻近的训练数据来对模型进行微调，从而在为每个用户做推荐之前确保特定样本的鲁棒性，在实时中具有防御强度，在不改变模型结构和训练过程的情
PDF9 months ago
两个智能体强化学习中的隐式毒化攻击：对训练时间攻击的敌对策略
在两个代理环境中，研究了攻击者通过修改同伴的策略来隐性毒化其中一个代理器的有效环境的针对性中毒攻击，并提出了一个优化框架，用于设计最优攻击。通过实验展示了算法的有效性。
PDFa year ago
ICLR巫婆之酿：通过梯度匹配实现工业规模数据毒化
本文针对数据污染攻击进行研究，发现匹配恶意示例梯度方向的攻击方法能够对现代深度网络造成威胁，且现有的防御策略并不能有效对抗此类攻击，进一步证明数据污染对大规模深度学习系统是一个可信的威胁。
PDF4 years ago
机器学习何时失败？对逃逸和毒化攻击的普适可迁移性
我们提出了 FAIL 攻击模型，通过四个维度描述对手的知识和控制，用于考虑更多的较弱对手并设计了实用的 StingRay 计划攻击 4 种机器学习应用，该攻击既可以绕过两个现有的防御措施，也适用于广义的可传递性。
PDF6 years ago