BriefGPT.xyz
大模型
Ask
alpha
关键词
hard-label
搜索结果 - 2
EMNLP
TextHacker: 基于学习的混合局部搜索算法用于文本硬标签对抗攻击
该研究提出了一种基于单独预测标签的敌对攻击 TextHacker,通过学习词汇替换对文本输出标签的影响来确定关键词汇,采用混合本地搜索和攻击历史估计词汇重要性来最小化被攻击文本所需的修改,该攻击在文本分类和文本蕴含方面具有显著的优越性。
PDF
2 years ago
黑盒解剖仪:面向基于擦除的硬标记模型窃取攻击
该研究提出了一种新的黑盒模型窃取方法,主要包括基于 CAM 的擦除策略和基于随机擦除的自知识蒸馏模块,通过从受害者模型中获取潜在的信息容量并使用替代模型的软标签缓解过度拟合问题,最终能够提高模型窃取效果达到最多 8.27%的提升,并有望在实
→
PDF
3 years ago
Prev
Next