BriefGPT.xyz
Ask
alpha
关键词
transfer attack
搜索结果 - 4
ACL
可迁移性嵌入反转攻击:揭示文本嵌入的隐私风险,无需模型查询
研究了与文本嵌入相关的隐私风险,重点关注攻击者无法访问原始嵌入模型的情景。通过开发一种传递攻击方法,利用替代模型模拟受害模型的行为,使攻击者能够从文本嵌入中推断敏感信息,从而揭示了嵌入技术中潜在的隐私漏洞,强调了加强安全措施的必要性。
PDF
24 days ago
图像水印的转移攻击
提出了一种新的转移攻击方法,该攻击方法在无盒环境下对图像水印进行干扰,使得对手训练的多个替代水印模型无法检测到水印,同时也能规避目标水印模型检测。理论和实验证明了基于水印的 AI 生成图像检测器不具备抵抗干扰攻击的鲁棒性,即使攻击者无法访问
→
PDF
3 months ago
MM
图像解释的重要性:现实世界对抗图像中语义误分类的模式
该论文提出了一种新的方法来评估对抗样本,即基于语义误差而非标签误差,并证明了这种方法具有更高的实用性和应用性。
PDF
2 years ago
MM
标签曝光中的成员信息泄漏
本文提出了基于决策的成员推理攻击方法,证明了仅利用标签信息的模型也容易受到成员泄漏攻击,并且开发了两种决策攻击类型:转移攻击和边界攻击。最后,我们评估多种防御机制,并展示了我们提出的两种攻击方式可以绕过大部分防御。
PDF
4 years ago
Prev
Next