Oct, 2021

CLIP-Adapter: 特征适配器提升视觉语言模型

TL;DR本文提出一种新的视觉语言模型 fine-tuning 方式 ——CLIP-Adapter,通过在原训练模型上加入新特征层并进行残差式混合来实现,在各种视觉分类任务中表现优异,优于 context optimization