CVPRMar, 2024

通过专家混合适配器增强视觉语言模型的持续学习

TL;DR提出了一种参数高效的持续学习框架,通过在视觉语言模型中动态扩展一个预训练的 CLIP 模型,采用专家混合(Mixture-of-Experts)适配器以应对新任务,并引入分布鉴别自动选择器(DDAS)以保留视觉语言模型的零样本识别能力,并通过各种实验验证,该方法在提升性能的同时减少了 60% 的参数训练负担。