May, 2024

隐私感知的视觉语言模型

TL;DR本文介绍了一项关于 Visual Language Models(VLMs)处理隐私敏感信息的研究,引入了一个新的基准 PrivBench,并在其中评估了 10 个最先进的 VLMs。研究结果表明,VLMs 对隐私的理解普遍有限,因此提出了一个新的训练数据集 PrivTune,通过在此数据集上调整预训练的 VLMs,取得了对敏感内容的强大识别能力,并说明隐私调整几乎不影响 VLMs 在标准基准测试上的性能。总的来说,本文提出了使 VLMs 在处理现实世界数据时安全有效的重要挑战,并提供了首次构建隐私感知 VLMs 的简单方法。