Oct, 2023

CLIP 融合模型库专家:视觉增强的伪监督

TL;DR通过在CLIP训练中结合任务特定的视觉模型,利用伪标签来改进其视觉表示,该简单的设置在不妨碍现有性能的前提下,显著提高了不同视觉任务的效果。