Apr, 2024

通过缩放的正负样本对比学习提升组合图像检索

TL;DR通过构建三元组并利用大型多模态语言模型,提出了解决复合图像检索问题的数据生成方法,并设计了用于优化表示空间的两阶段微调框架,实验结果显示方法在多个数据集上实现了最先进的结果,并在低资源场景下的复合图像检索中表现出色。