CVPRJun, 2021
基于自然语言和时空变换器的车辆检索
All You Can Embed: Natural Language based Vehicle Retrieval with Spatio-Temporal Transformers
Carmelo Scribano, Davide Sapienza, Giorgia Franchini, Micaela Verucchi, Marko Bertogna
TL;DR本文介绍了一个模块化解决方案 All You Can Embed (AYCE),旨在将单车跟踪序列与自然语言相关联以解决智慧城市应用中结合视觉与文本信息的问题,其核心为使用 BERT 提供文本描述的嵌入和卷积背骨和 Transformer 模型嵌入视觉信息。