BriefGPT.xyz
大模型
Ask
alpha
关键词
synonym substitution attacks
搜索结果 - 2
真正的同义词替换攻击有多远?
本研究探讨了同义词替换攻击(SSAs)的实际可行性,并揭示当前 SSA 中存在的未解决问题,包括四种常用的替换方法产生大量无效替换单词,语法及语义约束不足以检测到无效的样本,该研究为今后构建更好的 SSAs 提供了重要的契机。
PDF
2 years ago
重新评估自然语言中的对抗样本
通过分析最先进程序的同义词替换攻击,本文提出了成功自然语言攻击的定义 —— 伪造的文本必须欺骗模型、遵守一些语言约束,并发现其扰动往往不能保持语义,而人类调查表明交换词汇的嵌入和原始 / 扰动句子的句子编码之间的最小余弦相似性应显著提高以保
→
PDF
4 years ago
Prev
Next