BriefGPT.xyz
Ask
alpha
关键词
query-based attack
搜索结果 - 3
基于查询的对抗性提示生成
通过使用具有 API 访问的远程语言模型构建具有更高概率发出有害字符串的对抗性示例,我们改进了之前的工作,并验证了我们的攻击在 GPT-3.5 和 OpenAI 的安全分类器上的有效性。
PDF
5 months ago
元学习通用黑盒对抗攻击
文章提出了利用历史攻击反馈信息来降低黑盒对抗攻击的查询成本,通过开发一个元学习框架来训练元 Perturbation 生成器,以产生有效的干扰,同时利用模型级对抗可迁移性来训练元生成器,以帮助攻击目标模型。这个框架可以与任何现成的基于查询攻
→
PDF
2 years ago
QAIR: 实用的查询效率高的黑盒攻击图像检索
本研究通过 Quantifying the Attack Effects on the Partial Retrieved List 方法,提出了第一种针对黑盒情况下图片检索的基于查询的攻击(QAIR)方法,并采用了新的基于相关性的损失设计
→
PDF
3 years ago
Prev
Next