ECCVOct, 2022

使用 ViT CLIP 的通用图像描述符用于开放世界图像检索

TL;DR本文介绍了 Google Universal Image Embedding Challenge 竞赛中 4th place 的解决方案,重点讲述了用 CLIP 对零样本 Vision Transformers 进行微调的技巧,从而在多领域图像表示方面取得优秀的效果。