BriefGPT.xyz
Ask
alpha
关键词
word substitutions
搜索结果 - 3
ICLR
迈向自然语言词替换的鲁棒性
本文提出了一种新颖的 extit {Adversarial Sparse Convex Combination} (ASCC) 方法,将单词替换攻击空间建模为一个凸包,并利用正则化项来实现对实际替换的扰动,从而更好地对齐离散文本空间。基于
→
PDF
3 years ago
通过计算最大安全半径评估文本分类的稳健性
本文研究神经网络 NLP 模型在遭受单词替换这一领域的攻击时的鲁棒性,并提出了一个最大安全半径的概念作为鲁棒性的度量标准,同时使用蒙特卡罗树搜索和线性边界技术计算最大安全半径的上下限。该方法在四个数据集上进行了验证,并与 LIME 进行了比
→
PDF
4 years ago
ACL
用频率引导的词替换技术检测文本对抗样本
本文提出了基于词频的敌对样本检测方法(FGWS),能够通过对置换词和相应替换词之间的词频差异进行检测,实验结果表明,FGWS 能够在 SST-2 和 IMDb 情感数据集上准确检测到敌对样本,并相比最近提出的扰动辨别框架的表现提升了 13.
→
PDF
4 years ago
Prev
Next