transfer attack | BriefGPT - AI 论文速递

关键词transfer attack

搜索结果 - 4

ACL可迁移性嵌入反转攻击：揭示文本嵌入的隐私风险，无需模型查询
研究了与文本嵌入相关的隐私风险，重点关注攻击者无法访问原始嵌入模型的情景。通过开发一种传递攻击方法，利用替代模型模拟受害模型的行为，使攻击者能够从文本嵌入中推断敏感信息，从而揭示了嵌入技术中潜在的隐私漏洞，强调了加强安全措施的必要性。
PDF24 days ago
图像水印的转移攻击
提出了一种新的转移攻击方法，该攻击方法在无盒环境下对图像水印进行干扰，使得对手训练的多个替代水印模型无法检测到水印，同时也能规避目标水印模型检测。理论和实验证明了基于水印的 AI 生成图像检测器不具备抵抗干扰攻击的鲁棒性，即使攻击者无法访问
PDF3 months ago
MM图像解释的重要性：现实世界对抗图像中语义误分类的模式
该论文提出了一种新的方法来评估对抗样本，即基于语义误差而非标签误差，并证明了这种方法具有更高的实用性和应用性。
PDF2 years ago
MM标签曝光中的成员信息泄漏
本文提出了基于决策的成员推理攻击方法，证明了仅利用标签信息的模型也容易受到成员泄漏攻击，并且开发了两种决策攻击类型：转移攻击和边界攻击。最后，我们评估多种防御机制，并展示了我们提出的两种攻击方式可以绕过大部分防御。
PDF4 years ago