BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-modality representation
搜索结果 - 2
ICCV
RCA-NOC: 相对比对对齐用于新颖物体字幕生成
通过相对对比学习,本研究提出了一种新颖的方法来学习视觉和语义对齐,从而实现新颖物体的描述。针对每个图像,通过利用基于 CLIP 的正负样本的相对性质增加标签,设置适当的对比学习目标,并且将每个增强标签在列表中的排名作为相对相关性标签来对比每
→
PDF
7 months ago
对比视觉语言预训练
本文提出了一种基于对比学习的无偏置视觉 - 语言预训练方法,可以在多模态表示学习中获得更好的性能,在验证集 VQA、GQA 和 NLVR2 中取得了良好的结果。
PDF
4 years ago
Prev
Next