Mar, 2024

CVPR 2023 第一届基础模型挑战赛 - Track2 的解决方案

TL;DR本文提出了一种解决跨模态交通检索问题的方法,将问题分为行人检索和车辆检索两个子任务,并分别采用 IRRA 和 BLIP 作为基础模型,同时引入属性分类和基于属性的目标检测技术来增强图像和文本之间的对齐,取得了 70.9 的排名。