zero-shot image retrieval | BriefGPT

关键词zero-shot image retrieval

搜索结果 - 5

数据有效性视觉 - 语言对齐的课程学习
利用 TOnICS 算法对使用少量成对数据的预训练语言和视觉表示模型进行对齐，从而实现了使用更少的数据在 BERT 和 VinVL 预训练模型上进行映射，超越了 CLIP 在零样本图像检索方面的表现。
PDF2 years ago
ICML零样本图像检索的视觉 - 语义嵌入方法综述
本文关注零样本图像检索，使用句子作为查询条件，概述了该领域的技术趋势，包括图像与文本匹配的历史、常用的数据集和方法的评估结果，并介绍了 Github 上的实现，旨在鼓励研究者进一步发掘语言与图像之间的联系。
PDF3 years ago
多模态转换器中数据、注意力和损失的解耦
本文章论述通过训练多模态 transformer 模型，其在语言和视觉任务上的表现证明了其可以学习到丰富的视觉 - 语言表达。其着重于零样本图像检索任务，并研究了三个重要因素：预训练数据、注意机制和损失函数，以评估其对于模型性能的影响。
PDF3 years ago
CVPR基于混合注意力的解耦度量学习用于零样本图像检索
本文提出了一种 Decoupled Metric Learning（DeML）框架，用于零样本图像检索任务，针对该任务中的学习行为问题，本文实现了学习视觉判别度度量和防止学习者的部分 / 选择性行为，在流行基准测试中明确展示了这些重要问题的
PDF5 years ago
AAAI能量混淆的对抗度量学习在零样本图像检索和聚类中的应用
本文提出了一种新的基于 Energy Confused Adversarial Metric Learning (ECAML) 框架的深度度量学习方法，该方法通过引入混淆因子，实现优化强鲁棒度量学习。该方法不仅重视判别性，更强调了泛化能力对
PDF5 years ago