BriefGPT.xyz
Ask
alpha
关键词
adversarial nibbler challenge
搜索结果 - 3
对抗性 Nibbler:一种用于识别文本到图像生成中多样化伤害的开放式红队方法
从生成图像的文本到图像(T2I)生成 AI 模型的发展中,评估模型对非明显攻击的鲁棒性至关重要。在本文中,我们通过关注 “隐式对抗” 提示(触发 T2I 模型因非明显原因生成不安全图像的提示),独立确定了一组难以发现的安全问题,而人类创造力
→
PDF
5 months ago
从安全基准筛选敌对提示:关于敌对咬地机挑战的报告
文本条件的图像生成模型在图像质量和对齐性方面取得了惊人的结果,然而它们依赖于从网络随机获取的数量庞大的数据集,因此也会生成不安全的内容。作为对 Adversarial Nibbler 挑战的贡献,我们从现有的安全基准中提取了超过 1,000
→
PDF
10 months ago
对抗性 Nibbler:一个以数据为中心的挑战,用于提高文本到图像模型的安全性
该研究旨在解决文本到图像(text-to-image,T2I)模型的安全问题,通过引入 Adversarial Nibbler 挑战,通过收集和分析对当前 state-of-the-art T2I 模型的攻击,来提高人们对这些问题的认识。
PDF
a year ago
Prev
Next