BriefGPT.xyz
大模型
Ask
alpha
关键词
zero-shot image retrieval
搜索结果 - 5
数据有效性视觉 - 语言对齐的课程学习
利用 TOnICS 算法对使用少量成对数据的预训练语言和视觉表示模型进行对齐,从而实现了使用更少的数据在 BERT 和 VinVL 预训练模型上进行映射,超越了 CLIP 在零样本图像检索方面的表现。
PDF
2 years ago
ICML
零样本图像检索的视觉 - 语义嵌入方法综述
本文关注零样本图像检索,使用句子作为查询条件,概述了该领域的技术趋势,包括图像与文本匹配的历史、常用的数据集和方法的评估结果, 并介绍了 Github 上的实现,旨在鼓励研究者进一步发掘语言与图像之间的联系。
PDF
3 years ago
多模态转换器中数据、注意力和损失的解耦
本文章论述通过训练多模态 transformer 模型,其在语言和视觉任务上的表现证明了其可以学习到丰富的视觉 - 语言表达。其着重于零样本图像检索任务,并研究了三个重要因素:预训练数据、注意机制和损失函数,以评估其对于模型性能的影响。
PDF
3 years ago
CVPR
基于混合注意力的解耦度量学习用于零样本图像检索
本文提出了一种 Decoupled Metric Learning(DeML)框架,用于零样本图像检索任务,针对该任务中的学习行为问题,本文实现了学习视觉判别度度量和防止学习者的部分 / 选择性行为,在流行基准测试中明确展示了这些重要问题的
→
PDF
5 years ago
AAAI
能量混淆的对抗度量学习在零样本图像检索和聚类中的应用
本文提出了一种新的基于 Energy Confused Adversarial Metric Learning (ECAML) 框架的深度度量学习方法,该方法通过引入混淆因子,实现优化强鲁棒度量学习。该方法不仅重视判别性,更强调了泛化能力对
→
PDF
5 years ago
Prev
Next