CVPRApr, 2022

OMG:基于自然语言的车辆检索中观察多个粒度

TL;DR提出了一种基于多粒度观察(OMG)的新框架,用于通过自然语言描述在监控视频中查询受追踪车辆,并以多粒度对视觉表示、文本表示和目标函数进行优化,实验结果表明,该方法比以往所有方法的表现都好,获得了第 9 名的好成绩。