BriefGPT.xyz
大模型
Ask
alpha
关键词
model-transferability
搜索结果 - 1
针对多模式大型语言模型的越狱攻击
该研究聚焦于多模态大型语言模型(MLLMs)的越狱攻击,旨在引导 MLLMs 生成令人反感的响应来对抗危险用户查询。提出了一种基于最大似然的算法,可以寻找 “图像越狱提示”(imgJP),在多个未知提示和图像上实现对 MLLMs 的越狱。我
→
PDF
5 months ago
Prev
Next