ACLJan, 2021

VisualSparta:一种简单到可笑的加权词袋文本图像大规模搜索方法

TL;DR本文介绍了一种名为 VisualSparta 的基于稀疏变换匹配的 Transformer 模型,旨在实现跨模态信息检索领域中的文本检索图像任务,具有较高准确性和效率,可在大规模数据集中实现实时搜索。