BriefGPT.xyz
Ask
alpha
关键词
consistent multimodal contrastive loss
搜索结果 - 1
高效的令牌引导下的图像文本检索与一致多模态对比性训练
本文提出了一种基于 Token-Guided Dual Transformer (TGDT) architecture 的图像文本检索框架,将粗粒度和细粒度表示学习结合到一个统一的框架中,并提出了一种名为同步多模态对比损失的新型训练目标,通
→
PDF
a year ago
Prev
Next