Aug, 2023

CorrEmbed: 评估预训练模型图像相似性效果的新指标

TL;DR利用预训练的计算机视觉模型提取高级图像特征的图像嵌入相似性在识别具有相似组成的图像方面表现出显著的效果。本文提出了一种名为 CorrEmbed 的新方法,通过计算图像嵌入和人工生成的标签向量之间的距离相关性来评估来自多个预训练的计算机视觉模型的图像嵌入的可行性。我们使用这个指标广泛评估了多种预训练的 Torchvision 模型,揭示了 ImageNet1k 准确率分数和标签相关性分数之间的线性关系。值得注意的是,我们的方法还可以识别出与这一模式偏离的情况,从而揭示了不同模型如何捕捉高级图像特征。CorrEmbed 为研究人员和实践者在时尚零售中开发有效的基于数据驱动的相似物品推荐方法提供了一个强大的性能评估工具。