May, 2024

跨模态越狱与医疗多模态大语言模型的不匹配攻击

TL;DR介绍了 MedMLLMs(医学环境下的多模态大型语言模型)的安全漏洞,并提出了两种攻击类型(2M-attack 和 O2M-attack),并通过构建 3MAD 数据集进行评估,指出即使设计具有增强安全功能的 MedMLLMs 也存在安全漏洞,强调了在医疗环境中实施强大安全措施和增强开源 MedMLLMs 的安全性的紧迫性。