Oct, 2024

提升视觉语言模型对抗鲁棒性的混合防御策略

TL;DR本研究解决了视觉语言模型(VLM)在对抗攻击下鲁棒性不足的问题,提出了一种新颖的对抗训练框架,综合多种攻击策略和先进的机器学习技术。实验结果显示,该方法显著提升了VLM在真实数据集上的鲁棒性,CLIP模型在对抗扰动图像上的准确率从基准模型的4%提升至43.5%。