BriefGPT.xyz
大模型
Ask
alpha
关键词
cross-modal description
搜索结果 - 1
深入探讨多模式提示在细粒度视觉分类中的应用
本文介绍了一种基于 CLIP 模型的多模态提示解决方案(MP-FGVC),通过跨模态描述充分利用 CLIP 模型在细粒度视觉分类(FGVC)任务中的能力,并且通过多模态的协同推理进一步提高 FGVC 的性能。
PDF
10 months ago
Prev
Next