Jul, 2023

利用视觉 - 语言基础模型进行精细化下游任务

TL;DR本文提出了基于正 / 负提示公式的多任务微调策略来进一步利用视觉语言基础模型的能力,以解决 CLIP 等模型在细粒度属性检测和定位等下游任务中遇到的问题,并在 CUB200-2011 数据集上提高分类性能。