Sep, 2024

无训练的零样本复合图像检索方法:加权模态融合与相似性

TL;DR本研究解决了传统复合图像检索在模型训练中对大量数据集的依赖问题。提出了一种无训练的零样本复合图像检索新方法WeiMoCIR,通过加权平均有效融合图像和文本模态,简化了查询表示的构建过程。此外,利用多模态大语言模型生成数据库图像的文本描述,实验证明该方法在FashionIQ和CIRR数据集上提升了检索性能。