BriefGPT.xyz
大模型
Ask
alpha
关键词
intra-modal contrastive objective
搜索结果 - 1
CVPR
三重对比学习视觉语言预训练
本研究提出了一种名为 TCL 的视觉 - 语言预训练三重对比学习框架,通过交叉模式对齐和内部模态自我监督来提高学习的代表性,并通过最大化图像 / 文本局部区域与全局摘要之间的平均互信息,取得了在图像 - 文本检索和视觉问答等任务中的优异表现
→
PDF
2 years ago
Prev
Next