Dec, 2023

RetailKLIP:使用单个 GPU 基于度量学习对 OpenCLIP 主干进行微调,实现零样本的零售产品图像分类

TL;DR该研究主要探索如何用最近邻分类的方法对零售产品或打包食品进行图像分类,并使用 CLIP 模型的视觉编码器进行微调以实现准确性与完全微调相当甚至超过完全微调的结果,从而节省资源和等待时间。