gradient-based attack | BriefGPT

关键词gradient-based attack

搜索结果 - 5

机器翻译模型面对敌对攻击表现强劲
深度学习模型中的对抗攻击通过对输入进行微小扰动，从而导致输出发生重大变化。我们的研究重点是这种对抗攻击对序列到序列（seq2seq）模型的影响，特别是机器翻译模型。我们引入了基本的文本扰动启发式算法和更高级的策略，例如基于梯度的攻击，该攻击
PDF10 months ago
分步损失远走高飞：用多步量化进行对抗文本攻击
通过在 token 概率的连续空间中搜索对抗样本、在量化 - 补偿循环中进行多步量化，我们提出了一种新的基于梯度的攻击 transformer-based 语言模型的算法，实验表明该方法在各种 NLP 任务中明显优于其他方法。
PDFa year ago
AAAI异步事件驱动数据的对抗性攻击
该研究提出了一种生成事件数据对抗样本并训练鲁棒模型的算法，通过添加 null 事件与设置时空位置来实现基于梯度的攻击，成功率达到 97.95％，相较于原模型，改进了在对抗事件数据上的鲁棒性。
PDF3 years ago
基于梯度的对抗攻击：针对文本转换器
本文提出了首个基于梯度的通用攻击转换器模型算法，通过搜索由连续矩阵参数化的对抗性样本分布实现梯度优化，并在各种自然语言任务中证明其白盒攻击表现的最先进性。此外，本文还展示使用对对抗分布进行采样实现的强大黑盒转移攻击匹配或超越现有方法，而仅需
PDF3 years ago
使用 AdaBelief 优化器和 Crop 不变性生成对抗样本
本文提出了 AdaBelief 迭代式快速梯度法（ABI-FGM）和不受图像裁剪影响的攻击方法（CIM）来提高对抗样本的可迁移性，并将其与其他梯度攻击方法自然结合，以生成更多的可传输对抗样本以抵抗防御模型。在 ImageNet 数据集上进行
PDF3 years ago