BriefGPT.xyz
大模型
Ask
alpha
关键词
fusion transformer
搜索结果 - 2
检索增强对比视觉 - 文本模型
本论文提出了 RECO 模型,该模型通过外部记忆检索获取精细化知识,应用于现有视觉文本模型中,并在 Stanford Cars、CUB-2011 和 OVEN benchmark 等多项任务中取得了显著性能提升。
PDF
a year ago
CVPR
一次搞定 —— 用于视频检索的多模态融合 Transformer
本文提出一种基于多模态、模态无关的融合变压器方法,通过交换多个模态之间的信息并将其整合成一个联合的多模态表示,从而获得聚合多模态时态信息的嵌入,可用于零 - shot 检索和分类。我们在 HowTo100M 数据集上训练模型,并在四个具有挑
→
PDF
3 years ago
Prev
Next