BriefGPT.xyz
Ask
alpha
关键词
not-safe-for-work content
搜索结果 - 2
MMA-Diffusion:多模态对抗扩散模型
近年来,文本到图像(T2I)模型取得了显著进展并广泛应用,然而这一进展无意中开辟了潜在的滥用途径,尤其是生成不适宜或不安全的内容。我们的工作引入了 MMA-Diffusion,这是一个对 T2I 模型安全性构成严重和真实威胁的框架,通过有效
→
PDF
7 months ago
SneakyPrompt:评估文本到图像生成模型安全过滤器的鲁棒性
该研究提出了一种名为 SneakyPrompt 的自动化攻击框架,使用强化学习来生成可以绕过现有文本到图像生成模型的安全过滤器的不安全内容。实验表明,SneakyPrompt 不仅可以成功生成 NSFW 内容,而且在查询数量和图像质量方面也
→
PDF
a year ago
Prev
Next