关键词universal adversarial attacks
搜索结果 - 2
- 为什么通用对抗攻击可以对大型语言模型起作用?几何可能是答案
通过对包含 117M 个参数的 GPT-2 模型的攻击,我们发现这些通用对抗触发器可能仅仅是嵌入向量,它们近似于对抗训练区域中的语义信息,从而为大型语言模型的通用对抗攻击提供了一个新的几何学视角。
- IJCAI通用对抗攻击综述
本研究总结了最近在通用对抗攻击领域里取得的进展,讨论了攻击和防御方面的挑战以及通用对抗攻击存在的原因,旨在成为一项动态研究,不定期更新其内容,包括图像、音频、视频和文本等多个领域,欢迎该领域的作者联系我们,以纳入您的新发现。