Aug, 2023

朝着具有 CLIP 的逼真无监督微调

TL;DR通过将视觉语言模型 (VLMs) 应用于下游监督学习任务,本文探讨了无监督微调 CLIP 模型,解决了未知类别的样本和识别预定义类别实例的问题,并提出了一种称为通用熵优化 (UEO) 的简单有效的微调方法。通过广泛的实验,我们证明了 UEO 方法在泛化能力和检测未知类别样本方面优于基线方法。