BriefGPT.xyz
大模型
Ask
alpha
关键词
fast and accurate retrieval
搜索结果 - 1
CVPR
快与慢的思考:利用 Transformer 进行高效的文本 - 图像检索
本研究通过将视觉和文本独立地映射到联合嵌入空间中的双编码器方法和使用跨注意力的视觉文本变压器方法来进行大规模图像和视频数据集的基于语言的搜索,并将两种方法相结合,提高了检索准确性并确保了可扩展性,同时还引入了新的细粒度跨注意力架构,并通过蒸
→
PDF
3 years ago
Prev
Next