Apr, 2024

AdvLoRA: 视觉 - 语言模型的对抗低秩适应

TL;DR通过大量实验,我们展示了传统的视觉 - 语言模型(VLMs)所采用的常规适应方法的脆弱性,这可能带来重大的安全风险。此外,随着 VLMs 规模的增加,对 VLMs 进行传统的对抗性适应技术会带来高计算成本。为了解决这些问题,我们提出了一种名为 AdvLoRA 的参数高效对抗性适应方法,通过低秩适应进行了改进,设计了一种基于参数聚类和参数对齐的新型重新参数化方法,进一步提高了鲁棒性,解决了模型安全性和资源浪费问题。通过大量实验证明了 AdvLoRA 的有效性和高效性。