Nov, 2024

VLSBench:揭示多模态安全中的视觉泄漏

TL;DR本研究针对多模态大语言模型(MLLMs)在安全性方面的不足,提出了视觉安全信息泄漏(VSIL)问题,指出现有的多模态安全基准未能充分考虑实际场景中的隐私风险。我们构建了一个新的多模态安全基准VLSBench,显示在VSIL情况下仅依赖文本对齐即可满足安全需求,而在无VSIL情况下,需要更具潜力的多模态对齐方法来提升安全性。