Oct, 2022

用文本-PCA描述图像集

TL;DR该研究旨在运用预先训练的视觉-语言模型,通过生成短语来语义上描述一组图像,从而捕捉到单个图像的属性和整个集合内部的变化,并通过对不同短语之间的相似度进行计算和比较,从而将图像集合的关键特征有效地捕捉和说明。