- DifAttack++:跨领域中基于层级解缠特征空间的查询高效黑盒对抗攻击
研究了高攻击成功率和良好泛化性的高效基于评分的黑盒对抗攻击方法,提出了一种基于分层解耦特征空间和跨域的新颖攻击方法 DifAttack++,通过自编码器和我们特别设计的 Hierarchical Decouple-Fusion(HDF)模块 - 基于硬标签的小样本黑盒对抗攻击
提出了一种新的针对硬标签的黑盒攻击的优化方法,利用经预训练的替代模型指导优化过程,实验证明该方法在不同目标模型架构下显著提高了攻击的查询效率,攻击成功率较基准测试提高了约 5 倍,特别是在 100 和 250 个查询预算下。
- AAAI多语种文本分类的生成对抗攻击
通过对多语言释义模型进行敌对目标的微调,我们提出了一种对抗性攻击算法,用于伪造多语言分类器的有效的对抗性样本,实验证明该方法在查询效率方面优于现有基准模型。
- 利用条件扩散模型提升对深度神经网络的黑盒攻击能力
在本文中,我们提出了一种新的黑盒攻击策略,条件扩散模型攻击 (CDMA),用于在受到查询限制的情况下提高生成对抗性样本的查询效率。CDMA 通过直接条件变换生成合格的对抗性样本,可以显著减少所需查询的数量。CDMA 通过采用条件去噪扩散概率 - 幽灵声:黑盒,查询有效的音频对抗攻击通过分秒级音素注入
通过优化梯度估计,PhantomSound 在几分钟内极大提高了黑盒攻击的查询效率,成功地攻击了语音助手并绕过了真实场景中的生物特征检测机制。
- 一种基于贝叶斯代理模型的 LLM 生成文本有效检测方法
本文提出了一种基于贝叶斯代理模型的机器文本检测方法,能够有效提高查询效率,并在低查询预算下实现更好的性能,相比于 DetectGPT,查询次数减少了最多 2 倍,AUROC 提高了 3.7%。
- MM用于遍历互联网的分布式子网规范
本文介绍了一种启示性框架,该框架基于 guided link traversal 的思想,旨在解决数据发布者和消费者之间的问题,从而提高由多个文档构成的 Web of Data 中的查询效率并提高数据质量。
- AAAI多标记投影下快速在线哈希
本文介绍了一种基于动态哈希思想的在线哈希方法,该方法可以更快地进行最近邻搜索,并考虑了多标签数据的监督关系,实现了高效的响应时间。
- 拉丁超立方采样基于查询效率的对抗攻击
本文提出了一种 Latin Hypercube Sampling based Boundary Attack (LHS-BA) 方法,其相比于现有的 SRS 方法,具有更好的均匀性和查询效率,可有效地生成边界攻击样本。在多个数据集上的实验表 - QEKD: 基于黑盒模型的无数据查询知识蒸馏
提出了一种新的查询高效知识蒸馏方法(QEKD),可以从黑盒模型 API 中进行查询有效学习,不需要实际数据,并在不同实际数据集上展现出良好性能。
- 函数网络的贝叶斯优化
本文提出了一种利用高斯过程来建模网络节点并以期望改进作为收获函数的贝叶斯最优化方法,通过利用网络中的中间输出信息,实现了比标准方法更高的查询效率和渐进一致性,并在多个合成和实际问题中表现出优异性能。
- ICML通过投影梯度估计的渐进尺度边界黑盒攻击
本研究提出了一种理论框架,用于分析和改善边界黑盒攻击的查询效率,发现攻击的最佳尺度可以显著提高效率,并提出了基于逐步缩放技术的 Progressive-Scale enabled projective Boundary Attack (PS - ICLR利用目标信息的文本对抗攻击的改进和提升
本文研究了利用目标模型输出和数据对攻击率和查询率的影响,并表明两者都可以提高,同时附加查询的开销有限。
- ECCV黑盒对抗攻击查询效率提升
本文提出了一种基于神经过程的黑盒对抗攻击方法(NP-Attack),利用神经过程对图像结构信息进行建模,以提高查询效率,实验结果表明,NP-Attack 能显著减少黑盒情况下的查询次数。
- AAAI通过零阶自然梯度下降实现查询有效的黑盒对手
本文提出了零阶自然梯度下降(ZO-NGD)方法,以设计对抗性攻击,通过采用零阶梯度估计技术和二阶自然梯度下降方法,在黑盒攻击场景中提高查询效率,并在图像分类数据集上进行实证评估,证明 ZO-NGD 相对于现有攻击方法可以获得显著的模型查询复 - ECCVSquare Attack:一种通过随机搜索的高效黑盒对抗攻击
《Square Attack》提出了一种基于分数的黑盒 l2 和 l - 无穷攻击,该攻击不依赖于局部梯度信息,因此不受梯度掩盖影响。Square Attack 基于随机搜索方案,它选择位于随机位置的局部方形更新,以便在每次迭代中扰动约在可 - 深度神经网络的高效元攻击
本研究提出了一种元攻击方法,通过元学习的方法从以前观察到的攻击模式中学习可推广的先验抽象,并利用这样的先验信息,可以从很少的查询和输出中推断攻击模式,从而显着减少模型查询的数量,而不会牺牲攻击性能。
- ICML简单黑盒对抗攻击
本文介绍了一个基于连续数值置信度分数的、高效构建黑盒中敌对图像的简单迭代算法,并且该算法同样适用于有目标和无目标攻击。作者使用少于 20 行的 PyTorch 代码在 Google Cloud Vision API 中展示了该算法的高效和有 - ICML黑盒攻击中,符号位没有二进制位拆分
本研究提出了一种黑盒敌对攻击算法,通过基于符号而非基于大小的梯度估计方法,将黑盒优化从连续转移为二进制黑盒优化,从而达到了最新的模型逃避率和高效查询率,在 MNIST、CIFAR10 和 IMAGENET 数据集方面比现有算法更加准确和快速 - 主动学习实现的查询效率高的黑盒攻击
本文探究了 DNN 的黑盒攻击方案,使用现有的白盒攻击方法产生的采样样本进行训练替代模型,并提出主动学习策略和多样性准则以优化其表现,实验证明该方法可以将查询数量减少超过 90% 并保持黑盒攻击成功率。