分步损失远走高飞：用多步量化进行对抗文本攻击

Feb, 2023

分步损失远走高飞：用多步量化进行对抗文本攻击

Step by Step Loss Goes Very Far: Multi-Step Quantization for Adversarial Text Attacks

Piotr Gaiński, Klaudia Bałazy

TL;DR通过在 token 概率的连续空间中搜索对抗样本、在量化 - 补偿循环中进行多步量化，我们提出了一种新的基于梯度的攻击 transformer-based 语言模型的算法，实验表明该方法在各种 NLP 任务中明显优于其他方法。

Abstract

We propose a novel gradient-based attack against transformer-based language models that searches for an adversarial example in a continuous space of token probabilities. Our algorithm mitigates the gap between ad

adversarial example gradient-based attack transformer-based language models quantization-compensation loop natural language processing

发现论文，激发创造

基于梯度的对抗攻击：针对文本转换器

本文提出了首个基于梯度的通用攻击转换器模型算法，通过搜索由连续矩阵参数化的对抗性样本分布实现梯度优化，并在各种自然语言任务中证明其白盒攻击表现的最先进性。此外，本文还展示使用对对抗分布进行采样实现的强大黑盒转移攻击匹配或超越现有方法，而仅需要硬标签输出。

Apr, 2021

QuantAttack：利用动态量化对抗视觉转换器

该论文介绍了 QuantAttack，一种针对量化模型的新型威胁方法，通过精心设计的对抗样本耗尽操作系统资源，导致最坏情况性能，从而减慢推理速度，增加内存使用和能量消耗，实验证明了针对视觉转换器的攻击在各种任务中的有效性，包括单模态和多模态，并研究了不同攻击变种和模型之间的可转移性。

Dec, 2023

基于转换器的文本分类器的量化对鲁棒性的影响

本文探讨了量化对基于 Transformer 模型的鲁棒性的影响，并通过对 BERT 和 DistilBERT 模型在文本分类中对 SST-2、Emotion 和 MR 数据集以及 TextFooler、PWWS 和 PSO 敌对攻击的评估，发现量化显著提高了模型的敌对准确性（提高平均 18.68%）。此外，与敌对训练方法相比，量化平均提高了 18.80% 的模型鲁棒性而无需额外的计算开销。因此，本研究结果强调了量化在提高 NLP 模型鲁棒性方面的有效性。

Mar, 2024

一步前進與回退：克服損失感知量化訓練中的曲折問題

本文提出了一种新的损失感知量化方法，通过一步前进和回溯的方式来获取更准确、更稳定的梯度方向，解决了梯度下降学习过程中梯度方向快速震荡的问题，实验证明该方法在收敛性能上具有竞争力且优于其他方法。

Jan, 2024

量化网络的改进梯度对抗攻击

本文研究了神经网络量化模型的鲁棒性问题，并发现其在面对基于梯度的对抗攻击时存在梯度消失的问题，提出一种简单的温度缩放方法以减轻该问题，该方法在多个数据集与网络结构上表现出比现有方法更好的性能表现。

Mar, 2020

学习步长量化

本研究提出了一种训练低精度神经网络的方法，Learned Step Size Quantization，该方法使用 2、3 或 4 位字长量化权重和激活函数，并能够训练 3 位模型达到完全精度基线准确性，在 ImageNet 数据集上实现了迄今为止最高的准确性。

Feb, 2019

自我蒸馏量化：在基于 Transformer 的语言模型中实现高压缩率

通过后训练量化和量化意识训练来研究 Transformer 语言模型的概括化效果。提出了一种称为自身蒸馏量化（SDQ）的方法，该方法最小化积累的量化误差，并优于基线。将 SDQ 应用于多语言模型 XLM-R-Base 和 InfoXLM-Base，并证明两个模型可以从 32 位浮点权重减少到 8 位整数权重，同时在 XGLUE 基准上保持高水平的性能。我们的结果还突出了量化多语言模型的挑战，这些模型必须概括他们没有针对性微调的语言。

Jul, 2023

一种针对神经机器翻译模型的对抗攻击松弛优化方法

本文提出了一种基于优化的对抗攻击方式来攻击神经机器翻译模型，并在实验中取得了成功的效果，同时提出了针对黑盒攻击的扩展方法。

Jun, 2023

机器翻译模型面对敌对攻击表现强劲

深度学习模型中的对抗攻击通过对输入进行微小扰动，从而导致输出发生重大变化。我们的研究重点是这种对抗攻击对序列到序列（seq2seq）模型的影响，特别是机器翻译模型。我们引入了基本的文本扰动启发式算法和更高级的策略，例如基于梯度的攻击，该攻击利用可微分逼近的非可微分翻译度量。通过我们的调查，我们提供了证据表明机器翻译模型对已知最佳对抗攻击显示出鲁棒性，因为输出中的扰动程度与输入中的扰动成正比。然而，在次优方法中，我们的攻击方法优于其他方法，提供了最佳的相对性能。另一个有力的候选方法是基于混合单个字符的攻击。

Sep, 2023

针对基于 Transformer 的文本分类器的块状稀疏对抗攻击

本文提出了一种基于梯度的对抗攻击方法，应用于基于 Transformer 的文本分类器中，实验结果表明，该攻击能够在保留句子语义的同时，对不同数据集上的 GPT-2 分类器准确率进行有效降低，通过对优化问题进行块稀疏约束，实现了对抗向量的小幅扰动。

Mar, 2022