Jun, 2024

多模态代理的对抗攻击

TL;DR基于视觉和语言的模型对自主多模态代理进行了攻击,展示了新的安全风险,并通过对抗性文本字符串指导基于梯度的扰动来执行对手目标。