Sep, 2023

深入探讨多模式提示在细粒度视觉分类中的应用

TL;DR本文介绍了一种基于 CLIP 模型的多模态提示解决方案(MP-FGVC),通过跨模态描述充分利用 CLIP 模型在细粒度视觉分类(FGVC)任务中的能力,并且通过多模态的协同推理进一步提高 FGVC 的性能。